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حول المؤلف 
البروفيسور روب كيتشن 


هو باحث رئيسي في ا مجلس الأوروبي للبحوث المتقدمة (European Research Council)‏ 
في جامعة إيرلندا الوطنية في ماينوث. وقد قام بتأليف وتحرير كتب عديدة أخرى ناهزت ثلاثة 
وعشرين كتاباً وكان قد حاز على الميدالية الذهبية للعلوم الاجتماعية من الأكاديمية الملكية 
الأبرلندية للعام .Y -W‏ وهو الباحث الرئيسي للحاوية الرقمية الأيرلندية والمرصد البحثي 
لعموم الجزيرة الأيرلندية. 
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قائمة المحتويات e:‏ — ———— 
قائمة الجداول البيانية —— ————— ——— 


Su RN EAE AN EM ADM الأشكال الرسومية‎ LEG 


الفصل الأول: تصور ملفهوم البيانات E‏ —————— 
الفصل الثاني: البيانات الصغيرة. والبنى التحتية للبيانات» ووسطاء البيانات yT‏ 
الفصل الثالث: البيانات اممفتوحة والبيانات المرتبطة Ty‏ 
الفصل الرابع: البيانات الكبيرة M‏ 
الفصل الخامس: ممكنات البيانات الكبيرة ومصادرها ERN‏ 1111 
الفصل السادس: آليات تحليل البيانات Pee‏ 
الفصل السابع: المبررات الحكومية والتجارية للبيانات الكبيرة yT‏ 
الفصل الثامن: إعادة صياغة أبحاث العلوم» والعلوم الاجتماعية» والعلوم الإنسانية wow‏ 
الفصل التاسع: القضايا الفنية والتنظيمية #9 D‏ 


الفصل العاشر: المخاوف ASI‏ والسياسية» والاجتماعية» والقانونية 00 
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قانئمة الجداول 


الجدول الصفحة 
مستويات قياس البيانات WO a a R‏ 
cob sad‏ الستة لبيانات نظام رصد ومراقبة الأرض الخاص بوكالة الفضاء الأمريكية FE um‏ 
الأدوات والعناصر لمجاميع البيانات Bi. ced 0 E‏ 
مقارنة البيانات الصغيرة والبيانات الكبيرة e‏ 
أنواع وأمثلة البنى التحتية للبيانات ———- | 


مجموعة منتقاة من مؤسسات تقديم ا مشورةء والضغط لكسب التأييدء والتنسيق 
للمحافظة على البيانات وإتاحتها للوصول والمشاركة وإعادة الاستخدام في العلوم 


الاجتماعية والإنسانية "mm‏ 
فوائد مستودعات البيانات والبنى التحتية للبيانات و8 0 N‏ 
الخصائص AJEL‏ للبيانات المفتوحة المتعلقة بتعريف الانفتاح MM‏ 
مبادئ منظمة الحوكمة ال مفتوحة للبيانات اللفتوحة 00010108 0 SY‏ 
المستويات الخمسة للبيانات المفتوحة والبيانات المرتبطة fl nein‏ 
نماذج التمويل ممبادرات البيانات المفتوحة 000000000 2 
مقاييس البيانات الرقمية I‏ 1000 
مهام وأساليب التنقيب عن البيانات MAO h‏ 
أنماط ذكاء البيانات الكبيرة للشركات د07 ا HE‏ 
فوائد البيانات الكبيرة لعشر صناعات مختارة PU usnesnssbiRUEEMNE MEN EUM‏ 
نماذج العلم الأربعة mr EE‏ 1 
الخبرات اللازمة لبناء البنى التحتية للبيانات وإجراء بحوث البيانات الكبيرة NT. hs‏ 
تصنيف الخصوصية AE E‏ 
مبادئ ال ممارسة العادلة للمعلومات E e cn‏ 
أنواع المعلومات ال محمية 0 ا ا W‏ 
المبادئ السبعة الأساسية للخصوصية من خلال التصميم OO O‏ 
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قائمة الأشكال الرسومية 


الشكل 

٠-١‏ هرم المعرفة O N E‏ ا 
١-۲‏ الأسثلة المتعلقة بالأفراد خلال التعداد السكاني الإيرلندي للسكان ما بين e ٠۹۹1-۱۸٤١‏ 
١-۴‏ التقاطع بين أدوات مجاميع البيانات 986 1*0 
٠-١‏ التوزيع الجغرافي لتغريدات التخوف من امثليّة في الولايات المتحدة الأمريكية bee‏ 
1-7 المواقع اللحظية مسار الرحلات الجوية aE‏ 
deg] ٠-۴‏ معلومات مدينة لندن الخاصة بالمركز البريطاني للتحليل العمراني المتقدم "m‏ 
T‏ مجموعة أدوات التحليلات الجغرافية الصورية التي وضعها المركز الوطني للتحليلات 

الصورية في جامعة ينكوبينج uch (Linkóping University)‏ 
- استخدام مجموعة أدوات التحليلات الجغرافية الصورية في بناء الرواية 

القصصية الجماعية ——n‏ —— —— 
۷-١‏ التسويق والبيانات الكبيرة ————Ó‏ —— 
۷-۲ مركز العمليات لوسط مدينة ريودي جانيرو ERE‏ ا 
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شكر وتقدير: 

بدأت نشأة هذا الكتاب في أوائل الشهر السابع (يوليو/ OLT‏ من العام ۲١٠۲‏ خلال 
مناقشة بمقهى ف أدنبرة مع روبرت روجك (Robert Rojek)‏ من شركة سايج للنشر 
(SAGE)‏ حيث كنت قد اقترحت عليه البحث عن شخص لكتابة مصنف عن البيانات 
الكبيرة: والبيانات المفتوحة: والبنى التحتية للبيانات» مع تقديم الأفكار وإسداء النصح 
عن ذلك الشخص الذي قد يكون مناسباً لصياغة النص في مثل هذا الموضوع. وكان يرى في 
حينه أني ذلك الشخص المناسب لتلك المهمة. فقررت في وقت لاحق» بعد مضي عدة أشهرء 
الموافقة بين خطط كتاباق والجمع بينهاء بحيث بدأت في صياغة ما بدا في متناول اليد خلال 
فترة زمنية قصيرة lur‏ ويتناول التحليل النقدي ممشهد البيانات المتغير باطراد. تطور الكتاب 
مع مرور الوقت إلى مخطوط كامل يسعى إلى الدراسة المستفيضة للاتجاهات والمناقشات 
الناشئة بتأن وإنصاف. وبالتزامن مع U‏ بقي روبرت متابعاً متحمساً ومصدراً للعديد من 
ا مواد المثيرة للاهتمام» وكانت مساعدته موضع تقدير كبير جدا. وفي سايج أيضاًء ساعد زميله 
كيري ديكنز (Keri Dickens)‏ في الدفع بالكتاب إلى عملية الإنتاج والنشرء التي تم توجيهها 
على نحو مثير للإعجاب من قبل كاثرين هاو (Katherine Haw)‏ 


قام مارتن ودج (Martin Dodge)‏ وتريسي ب. لاوريولت (Tracey P. Lauriault)‏ 
بقراءة مفصلة ونقد هادف للمخطوط بالكامل وعلى نحو متناه في السلاسة واللطف. وقام 
مارك بويل (Mark Boyle)‏ بقراءة كامل المسودة الثانيةء كما قدّم غافن مكاردل Gavin)‏ 
(McArdle‏ وإيفلين روبيرت (Evelyn Ruppert)‏ نقداً مفيداً لبعض فصول الكتاب» وإضافة 
لذلك شارك عدد من الزملاء والأصدقاء في مداخلات نافعة ومناقشات مفيدة. حيث ولتي العديد 
منهم إلى مواد ذات «Alo‏ منهم مارك غراهام (Mark Graham)‏ تايلور شيلتون Taylor)‏ 
«(Shelton‏ مات زوك (Matt Zook)‏ مات ويلسون (Matt Wilson)‏ ليف مانوفيتش Lev)‏ 
(Manovich‏ سيان اوكالاهان «(Cian O'Callaghan)‏ سونغ - يوه بيرنج Sung-Yueh)‏ 
«(Perng‏ أيلين أوه كار ول (Aileen O'Carroll)‏ جين جراي «(Jane Gray)‏ ساندرا كولينز 
«Sandra Collins)‏ حون كيتنغ L3 (John Keating)‏ )53 ويب (Sharon Webb)‏ جوستين 
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جليسون (Justin Gleeson)‏ أو يف داولنغ (Aoife Dowling)‏ يوغان مکارٹ Eoghan)‏ 
(McCarthy‏ مارتن تشارلتون «Martin Charlton)‏ تيم مكار ölə (Tim McCarthy) à‏ 
ريجبي «(Jan Rigby)‏ روب برادشو (Rob Bradshaw)‏ آلان مور (Alan Moore)‏ دراش ماك 
دونشا (Darach Mac Donncha)‏ وجيم وايت .(Jim White)‏ كما تلقيت ردودا مفيدة bas‏ 
خلال العروض التقدهية في جامعة دورهام. وجامعة كلارك» وجامعة هارفارد. واهتمت رونا 
برادشوو (Rhona Bradshaw)‏ وأورلا دان (Orla Dunne)‏ بإدارة أعمال المكتب عندما كنت 
أحاول الانكباب على إجراء البحوث وكتابة الفصول. كما تفضلت جوستين جلسيون Justin)‏ 
بإنتاج بعض الرسوم البيانية. فأنا مدين لكم TUS‏ بالعرفان. كما أود T‏ شكر 
الكثير من الناس المشاركين على موقع التواصل الاجتماعي - التويتر وتغريداتهم التي أشارت إلى 
مواد مثيرة للاهتمام وانخراطهم في مناقشات علمية دقيقة ذات صلة. daly‏ الشكر موصول 
إلى كورا (Cora)‏ التي قامت بتثبيتي وقدمت d ET NT‏ 

وتم دعم جزء من الأبحاث التي أجريت في كتابة هذا الكتاب من خلال جائزة ا مجلس 
الأوروبي للبحوث المتقدمة, "المدينة المبرمجة" ERC-2012-AdG-323636; www.nuim.)‏ 
(ie/progcity‏ والتمويل المقدم من هيئة التعليم العالي في برنامج البحوث في اللمستوى 
الثالث للدورة الخامسة» والذي يهدف إلى إنشاء حاوية رقمية لأيرلندا. 

ويمكن الاطلاع على نسخة من مراجع الكتاب من خلال الرابط التالي: http://‏ 
.thedatarevolutionbook.wordpress.com‏ كما يجري بانتظام إضافة مصادر 
للمعلومات وتجارب حول ثورة البيانات على الرابط http://www.scoop.it/t/the-‏ 
.programmable-city‏ وبالطبع: فإن التعليقات والردود مرحب بها من خلال البريد 
الإلكتروني Rob.Kitchingnuim.ie‏ أو التغريد على حساب موقع التواصل الاجتماعي 
- تويتر robkitchin9‏ 


لقد سبق نشر بعض ال مواد الموجودة في هذا الكتاب على شكل أوراق بحثية أو على 
النشرات اليوميةء على الرغم من أنه قد تم تحديثهاء وإعادة صياغتهاء والتوسع فيها. ومنها: 
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e Dodge, M. and Kitchin, R. (2005) ‘Codes of life: identification codes and the 
machine-readable 
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and risks’, Dialogues in 
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e Programmable City Working Paper 1. Available at SSRN: http://ssrn.com/ 
abstract=2376148. 

e Kitchin, R. and Lauriault, T. (in press) ‘Small data in an era of big data; Geo 
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e Figure 1.1 is adapted from InformationisBeautiful.net with the permission of 
David McCandless. 

e Figure 1.2 is reproduced with the permission of The Statistical and Social 
Inquiry Society of Ireland. 

e Table 2.4 is included with the permission of Neil Beagrie, Brian Lavoie and 
Matthew Woollard and 

e under a creative commons licence for Fry et al., http://repository.jisc. 
ac.uk/279/. 

e Table 3.1 is reproduced from http://opendefinition.org/od/ under a creative 


commons licence. 
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Table 3.3 is included with the permission of Michael Hausenblas, 
http://5stardata.info/. 

Table 4.1 is reproduced with the permission of The Economist. The Economist 
Newspaper Limited, 

London, issued March 11, 2014. 

Figure 6.1 is reproduced with the permission of Monica Stephens. 

Table 6.1 is reproduced with the permission of Taylor and Francis. 

Figure 6.2 is reproduced with the permission of Flightradar24.com. 

Figure 6.3 is reproduced with the permission of Andrew Hudson-Smith. 
Figures 6.4 and 6.5 are reproduced with the permission of Professor Mikael 
Jern, National Center for 

Visual Analytics, Linköping University, http://ncva.itn.liu.se. 

Table 7.1 Forms of big data corporate intelligence is included with the 
permission of McKinsey & 

Company. 

Table 7.2 and Figure 7.1 are reproduced courtesy of International Business 
Machines Corporation, © 

International Business Machines Corporation. 

Figure 7.2 is reproduced from http://ipprio.rio.rj.gov.br/centro-de-operacoes- 
rio-usa-mapas-feitospelo- 

ipp/ under a creative commons license. 

Tables 10.2 and 10.3 are included with the permission of John Wiley & Sons. 
Table 10.4 is included with the permission of Ann Cavoukian, Ph.D., 


Information and Privacy Commissioner, Ontario, Canada. 
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ملاحظة: 


يعبر عن مصطلح البيانات (Data)‏ في هذا الكتاب في صيغة الجمع» مع استخدام 
مصطلح وحدة بيان (Datum)‏ للدلالة على امثل المفرد (Singular Instance)‏ بحسب ما 
هو موضح في قاموس أوكسفورد للغة الإنجليزية :(Oxford English Dictionary- OED)‏ 

في اللغة اللاتينية, البيانات هي صيغة جمع لكلمة «Oba‏ وتاريخياً وفي المجالات العلمية 
المتخصصة. على الخصوص. يتم التعامل أيضا مع مصطلح «البيانات» للدلالة على الجمع 
في اللغة الإنجليزية» حيث db‏ في سياق فعل الجمع (were)‏ كما في gi»‏ جمع البيانات 
وتصنيفها». 

ومع ذلك يستخدم هذا المصطلح على نحو متزايد 2 صيغة ال مفرد 2 وسائل الإعلام 
العامة والمحادثة اليومية. كما جرى تفصيل ذلك في قاموس أوكسفورد للغة الإنجليزية: 


ومع ذلك 2 العموم لا يجري التعامل مع مصطلح «البيانات» بصيغة الجمع 2 
الاستخدام غير العلمي الحديثء ولكن بدلا من EUS‏ يجرى التعامل معه كاسم إجمالي - 
للبند غير المعدود - على غرار كلمة «معلومات» التي تأخذ الفعل بصيغة المفرد. وأصبح 
من المقبول في اللغة الإنجليزية القياسية على مدى عدد من السنوات وعلى نطاق glo‏ 
الجمل من قبيل: «تم جمع البيانات» في سياق فعل المفرد «was»‏ 

لذاء يتبع هذا الكتاب الاصطلاح العلمي المعمول به. ومع ذلكء تم إبقاء النص على حاله 
حيثما اتفق ورود استخدامه بصيغة المفرد عند الاقتباس. ودون الجدل في أي الصيغتين هو 
«eel‏ فإن انحياز النحاة هو لصيغة فعل الجمع» ولكن الاستخدام العام الشائع هو أكثر 
انفتاحا ومرونة. 
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مقدمة: 

هناك تاريخ طويل للحكومات,. والأعمالء والعلوم والمواطنين فيما يتعلق بإنتاج واستخدام 
البيانات من أجل رصد bll‏ وتنظيمه, و edio‏ وجعله أكثر منطقا وذا مغزى. وقد 
كانت البيانات في Ball‏ تتكلفة 3,8439( وکا Wb‏ في الإنتاج والتحليل والتفسير وتوفر في 
العموم ضووة dB‏ غالبا مقوشة: 056-9 عن الظاهرة Lal oai‏ وفظرا للقدوة dual‏ 
كانت البيانات ذات الجودة العالية سلعة ذات dos‏ وعلى هذا الأساس كان التكتم الشديد 
والحرص عليها وتداولها وتبادلها بأثمان باهظة. ولكن هذا الوضع بدأ يتغير بشكل جذري 
تماما. فالبيانات لم تفقد شيئا من قيمتهاء ولكن جرى في نواح أخرى تحول في طبيعتها 
وطرق إنتاجها من خلال مجموعة ما وصفها )1997( Christensen‏ بالابتكارات المربكة, 
والتي مكلت هديا للوضع الراهن في كيفية et]‏ البيانات وإداراتها وتحليلها وتخزينها 
والاستفادة منها. C‏ من أن تكون البيانات نادرة ومحدودة 2 قدرة الوصول إليهاء غدت 
على نحو متزايد طرق إنتاج og Ed oL‏ سيلا Iaculis oae‏ من السافات isis‏ 
à‏ طبيعتهاء وامرتبطة منطقيا: والمتوافرة عند الحاجة إليها في الوقت المناسب. والمنخفضة 
(RE‏ في التكلفة. وخارج نطاق الأعمال في طبيعتهاء مع تنامي فتحها وازدياد قابلية وسهولة 
الوصول إليها. فثورة البيانات جارية في الوقت «ol JI‏ وهي تعمل بالفعل على إعادة 
تشكيل كيفية إنتاج المعرفة. وإجراء الأعمال» وحوكمة التشريعات والقوانين. 

لقد تأسست هذه الثورة في الموجة الأخيرة من تقنيات ال معلومات والاتصالات (ICTs)‏ 
وذلك من خلال عدد كبير من الأجهزة الرقمية التي نصادفها اليوم في ا منازل» وأماكن 
«Las‏ والأماكن العامة؛ كأجهزة الاتصال ال محمولة» والحوسبة الموزعة» والحوسبة السحابية؛ 
ووسائل التواصل الاجتماعي؛ وإنترنت الأشياء (أجهزة ووسائل استشعار مترابطة ومتصلة 
من خلال الشبكة العالمية -الإنترنت). فهذه الوسائط وا منصات التقنية الجديدة أضحت 
تقود وتوجه أكثر من أي وقت مضى المزيد من جوانب الحياة اليومية - العملء والاستهلاك, 
والسفرء والاتصالء والترفيه - وأضحت العوام التي نعيش فيها تفهم بهيئة بيانات وتسير 
من خلال التقنيات المعتمدة على البيانات. وعلاوة على EUS‏ فإن هذه الوسائط والمنصات 
التقنية الجديدة تعمل bols‏ ومنطقياً على Bele]‏ تشكيل طرق إنتاج» Jols‏ وتفسير 
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البيانات. وإنتاج ما اصطلح على تسميته «البيانات الكبيرة «Big data‏ حيث كميات هائلة 
من البيانات الرقمية المتغيرة والمتنوعة» والتي من السهولة بمكان الجمع بينهاء وتبادلهاء 
وتوزيعها من خلال شبكات تقنية المعلومات والاتصالات» وتحليلها بواسطة جيل جديد من 
أساليب تحليل البيانات (Data Analytics)‏ المعدّة لتتلاءم مع وفرة البيانات على العكس 
من ندرة البيانات المعتادة. ويتضح حجم طوفان البيانات الناشئة من خلال الادعاء بأنه 
"من فجر الحضارة وحتى العام Y «SY‏ أنتجت البشرية خمسة إكسا (Exabyte) Cob‏ 
من المعلومات فقط؛ في حين نحن بصدد إنشاء القدر نفسه من البيانات كل يومين" Hal)‏ 
iño Varian, chief economist with Google‏ من 2012 .(Smolan and Erwitt‏ 

ولا تعد البيانات الكبيرة المكون الوحيد لثورة البيانات, فبالأحرى كان هناك العديد 
من المبادرات المتصلة بعضها ببعض من قبيل التحول الرقمي (Digitization)‏ ربط 
وتوسيع مجموعات البيانات ا منتجة تقليدياً (البيانات الصغيرة) مع بعضها عبر بنى تحتية 
شبكية؛ وحركة البيانات المفتوحة التي تسعى لجعل أكبر قدر ممكن من البيانات متوفرة 
بشكل مفتوح للجميع للاستخدام؛ والهياكل المؤسسية الجديدة التي تسعى لتأمين المبادئ 
التوجيهية والسياسات المشتركة فيما يتعلق بأنماط تنسيق البيانات» ونماذج هيكلتهاء 
والبيانات الوصفية عنهاء وحقوق الملكية الفكرية» وتراخيص الاستخدام القانوني لهاء ومعايير 
ا لمشاركة بها. وتشكل هذه المبادرات مجتمعة مجموعة من مجاميع البيانات الجديدة 
- مزيج من نظم الفكرء وأشكال المعرفة» والتمويلء والاقتصادات السياسية» والتشريعات 
الحاكمة والجوانب القانونية وامادية الناظمة, والبني التحتية: وا ممارسات. والمنظمات 
والمؤسسات. والمجتمعات المحلية والشخصيات الاعتبارية» والأماكنء والأسواق - التي تؤطر 
لكيفية إنتاج البيانات والحدود القصوى لاستخداماتها الممكنة. 

ويظهر أثر البيانات الكبيرة» والبيانات المفتوحة» والبنى التحتية للبيانات بشكل جلي 
في مجالات العلوم» وقطاع الأعمالء والقطاع الحكوميء والمجتمع المدني. فالتخصصات 
الجديدة التي تم استحداثها بدأت الآن بالتعامل مع تدفق البيانات الهائل بعد التعود 


على العمل في جزر البيانات ام متفرقةء والسعي نحو استخراج المعلومات» واستخلاص النتائج 
من عدد قليل نسبيا من المشاهدات )2010 .(H.J. Miller‏ وقد اقترنت هذه التخصصات 
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مجالات جديدة. مثل علوم البيانات (Data Science)‏ والحوسبة الاجتماعية Social)‏ 
«(Computing‏ والعلوم الإنسانية الرقمية «(Digital Humanities)‏ والعلوم الاجتماعية 
الحاسوبية «(Computational Social Sciences)‏ والتي تعنى بشكل واضح ببناء البنى 
التحتية للبيانات وإيجاد طرق مبتكرة لتحليل وفهم معنى البيانات عند توسعها وكبر 
حجمها. ففي قطاع الأعمالء توفر البيانات الكبيرة وسائل جديدة لإدارة جميع مناحي 
أنشطة الشركة بصورة مرنة وفعالة ويستفاد منها لتحقيق أرباح إضافية من خلال تعزيز 
الإنتاجية» والقدرة التنافسية: والمعرفة بالسوق. كما أضحت البيانات نفسها سلعة «dolo‏ 
يتم شراؤها وبيعها مراراً في السوق العالمية بمليارات الدولارات. وبالنسبة للحكومات» وعلى 
نطاق واسع. توفر البيانات الديناميكية المتغيرة رؤى جديدة حول عملياتهاء فضلاً عن 
إعادة تشكيل وسائل الحكم وتنظيم المجتمع. فمن خلال تفحص قواعد البيانات اممفتوحة 
يستخلص المواطنون والمنظمات غير الحكومية (NGOs)‏ النتائج الخاصة «ea?‏ متحدين 
ا منظمات التجارية الربحية والأجندات الحكوميةء ويقدمون رؤى بديلة للكيفية التي 
ينبغي بها تنظيم ا مجتمع وإدارته. 

لقد أثارت هذه الفرص الجديدة طفرة حقيقية ملموسة في ما يمكن تسميته ب "تعزيز 
البيانات" «(Data Boosterism)‏ من خلال حشد الدعوات المبشرة بفوائد وآفاق البيانات 
الكبيرة» والبيانات المفتوحة: والبيانات الصغيرة الموسعة. والبعض من هذه الدعوات له 
ما يبرره» وبعضها الآخر مجرد غث وتهويل دعا لا حقيقة له البتة. في المقابلء أصبحت 
مصطلحات: البيانات الكبيرة والبيانات المفتوحة» أنماطاً ثقافية قوية في الانتشار والتأثير 
(ميمات (Memes-‏ وليست مجرد وسيلة لوصف البيانات ولكنها رمز لخطاب أوسع مدى 
يستخدم في حشد الدعم لها وانتشار اعتمادها والبدء في تطبيقها. فمع هذا الترويج 
والتعزيز أضحى من السهل الانجراف نحو تبني هذه المصطلحات دون انتقاد أو تمحيص 
للتغيرات التي تحدث والتي أثار العديد منها مخاوف أخلاقيةء ومحاذير سياسية وقانونية. 
ورغم ذلك فقد كشف التاريخ فيما مضى عن سوابق من الابتكارات المربكة المتعلقة 
با معلومات - على سبيل JULI‏ التحول الجذري في إنتاج المعرفة في أعقاب اختراع الطابعة. 
ومن حيث الواقع» فقد صاحب بداية كل ع صر جديد من العلم تقنيات جديدة أدت إلى 
زيادة مفرطة في البيانات وكانت مثابة شرارة التحول نحو طرق جديدة لإنتاج وتنظيم» 
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وتخزين» وتحليل» وتفسير البيانات )2000 .(Darnton‏ على سبيل اممثال» من ملاحظات 
(Strasser 2012)‏ فإن الاستكشافات في عصر النهضة. والتي تعززت بفعل أدوات علمية 
أفضل في الملاحة» ورسم الخرائطء قد أسفرت عن كميات هائلة من الاكتشافات الجديدة 
التي أدت إلى وسائل جديدة للتصنيفء وتقنيات جديدة في التحليل والتخزينء وأفكار 
علمية جديدة. 

ونظراً للمرحلة المبكرة نسبياً في ثورة البيانات الحالية» فإنه ليس من المؤكد تماما كيف 
ستتكشف وتستقر التحولات الحالية» وما الذي سيكون عليه نطاق عواقب التغيرات التي 
تحدث من منظور أوسع. فالواضح هو أن هناك حاجة ملحة doll‏ الإدراك والشعور Le‏ 
يحدث. وهكذاء فإن الهدف من هذا الكتاب هو تقديم إجماليء وتحليل مبدثي ودفيق 
للبيانات وكورة البيافات العازية الا فا الات سس من aee‏ ان قي الظرف 
والوسائل المتعلقة بإعادة تشكيل إنتاج ومعالجة وتحليل وتبادل البيانات» وما يعنيه هذا 
لكيفية إنتاج واستخدام المعلومات والمعرفة؛ وهو من جهة أخرى مهد للنقاش والتفكير 
النقدي حول البيانات: طبيعتهاء وكيفية تأطيرها من النواحي الفنية والفلس فية والأخلاقية 
والاقتصادية والفعميعات dais‏ واللؤسسية المخيطة بماد dag‏ مسن أن Bla sdszs‏ 
البيانات الكبيرة» والبيانات المفتوحة» والبنى التحتية للبيانات من خلال حالة عاطفية, أو 
نقد لاذع يشجب نتائج العواقب الأكثر سلبية du)‏ يقدم الكتاب NM bass TET‏ 
للتغييرات التي تحدث. 

ويستند التحليل المقدم في هذا الكتاب على مشاركة واسعة النطاق مما سبقه من 
مؤلفات في مختلف العلوم» والعلوم الإنسانية» والعلوم الاجتماعيةء ومن مطبوعات الثقافة 
الشعبيةء والإصدارات الصحافيةء والدوريات الصناعية:» وعلى خبرة مباشرة في العمل على 
أنظمة حفظ أرشيفية وبنى تحتية ومشاريع تحليلات لبيانات على نطاق مؤسسي واسع. 
وينقسم الكتاب إلى أحد عشر فصلاً. يقدم الفصل الأول لمحة عامة ونقداً فكرياً حول 
مفهوم البيانات وكيفية فهم قواعد البيانات والبنى التحتية للبيانات. ويبحث الفصل 
الثاني في الدور المستمر للبيانات الصغيرة والكيفية التي تم بها توسيع نطاقها إلى أرشيفات/ 
محفوظات رقمية وبنى تحتية» إلى أن وصلت إلى درجة التداول وبيعها من خلال وسطاء 
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البيانات. كما يناقش الفصل الثالث الدافع للتوجه نحو استحداث البيانات المفتوحة 
والبيانات المرتبطة التي يجري تقاسمها ومشاركتها وإعادة استخدامها على نطاق أوسع 
59,6 الوقت. ويبين الفصلان الرابع والخامس طبيعة البيانات الكبيرة بالتفصيل وعوامل 
التمكين للبيانات الكبيرة ومصادرها المساعدة على انتشارهاء في حين يقدّم الفصل السادس 
طحة dale‏ عن مجموعة جديدة من تحليلات البيانات التي ترمي إلى فهم البيانات الصغيرة 
الموسعة والبيانات الكبيرة. كما يدرس الفصلان التاليان (السابع والثامن) الحجج ال مستخدمة 
لتعزيز البيانات الكبيرة والترويج لها وبيان تأثيرها في الحوكمة والأعمالء والسبل التي تقوم 
بها ثورة البيانات على إعادة تشكيل كيفية تصور البحوث وممارستها. ويناقش الفصلان 
التاسع والعاشر التحديات التقنية والتنظيمية, والأخلاقية. والسياسية. والقانونية لثورة 
البيانات. ويحدد الفصل الأخير بعض الاستنتاجات الكلية eX is‏ خارطة طريق لإجراء 
المزيد من البحث والتاصيل. 
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الفصل الأول 
تصور لمفهوم البيانات (Conceptualising Data)‏ 


يتم فهم البيانات عادة على أنها المادة الخام التي تنتجها طرق تجريد العوالم من حولنا 
والتعبير عنها من خلال فئات» ومقاييس» وأشكال تمثيلية أخرى - كالأرقام, والحروفء 
والرموزء والصورء والأصوات. وا موجات الكهرومغناطيسية: والثنائية الرقمية - تشكل اللبنات 
الأساسية في بناء صروح المعلومات والمعرفة. ومع أن البيانات تعد بطبيعتها مُعبرة ومُمثلة 
للأشياء (على سبيل «JULI‏ القياسات المتعلقة بظاهرة ما كعمر الشخص.ء «dJglo‏ 4359« 439« 
خط lal das‏ عاداتة كان إقامعة وما إل EO‏ أنه هق BEER Sall‏ 
ضمنية (من خلال الغياب بدلا من الوجود)» أو مشتقة على سبيل «JE‏ البيانات التي يتم 
إنتاجها من البيانات الأخرى كالنسبة المئوية للتغير مع مرور الوقت والتي يتم احتسابها 
من خلال مقارنة البيانات من فترتين زمنيتين مختلفتينء ويمكن أن تكون البيانات مسجلة 
3555 إما في شكل تناظري (Analog)‏ أو من خلال ترميزها في شكل رقمي كأرقام ثنائية 
.(Bits)‏ وتتصف البيانات بأنها ذات جودة جيدة إذا كانت منفصلة وواضحة بمعنى أن 
تكون JS‏ وحدة بيان (Datum)‏ مفردة» ومستقلة وقابلة للانفصال. ومعرفة بشكل «eol‏ 
وتراكمية قابلة للحصر (يمكن أن تبنى في (Dlegar‏ ومرتبطة ببيانات وصفية لها (بيانات 
عن البيانات)» ويمكن ربطها مجموعات بيانات أخرى لتقديم رؤى وأفكار غير متوفرة من 
مجموعة بيانات واحدة )2013 (Rosenberg‏ وتتمتع البيانات باستخدام قوي وقيمة 
عالية كونها توفر المدخلات الأساسية لكافة مراحل التحليل التي يجري توظيفها من قبل 
الأفراد. وا مؤسسات» وقطاعات العلوم والأعمال لفهم وتفسير العالم الذي نعيش .4« والتي 
تستخدم بدورها لاستحداث الابتكارات: اممنتجات» السياسات» وا معارف التي تشكل الكيفية 
التي يعيش بها الناس حياتهم. 

ومن هناء تعد البيانات موردا رئيسيا في العصر الحديث. ومع «eL JS‏ ونظرا لفائدتها 
وقيمتهاء ومقدار الجهد وا موارد المخصصة لإنتاجها وتحليلهاء فمن اللافت للنظر كيف تم 
إيلاء القليل من الاهتمام للتصور المفاهيمي والإدراك المبدئي للبيانات في حدّ ذاتهاء وف 
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المقابل» هناك الآلاف من المقالات والكتب المكرسة لفلسفة ال معلومات والمعرفة. فكما أننا 
نميل في العادة للتركيز على المباني والأحياء عندما ننظر إلى od‏ بدلاً من الطوب والإسمنت 
المستخدم في بنائهاء فكذلك هو الحال مع البيانات. وعلاوة على EUS‏ وباممثل» كما اعتدنا 
التفكير بالطوب والإسمنت بصفتها مجرد وحدات بنيوية بدلا من عناصر تم تصنيعها داخل 
gila‏ من قبل شركات ملزمة ضمن اعتبارات لوجستية ومالية وقانونيةء وأنه يتم توزيعهاء 
وتخزينهاء وتداولهاء كذلك حالنا إلى حد كبير في التعامل مع البيانات. ونتيجة لذلك» وعندما 
تكون البيانات هي محور التساؤل والاهتمامء عادة ما يتم النظرء با معنى التقني إلى حد 
ous‏ إلى الكيفية التي ينبغي بها إنتاج وتحليل البيانات» أو الكيفية التي يمكن بها الاستفادة 
منها في إنتاج رؤى وقيم» وليس زيادة النظر في طبيعة البيانات من منظور مفاهيمي 
وفلسفي. 

ومع الأخذ بهذه الملاحظة في الاعتبار, فإن الهدف الرئيسي من هذا الكتاب هو مركب 
SL‏ الأبعاد. فيه: توفير شرح تفصيلي عن طبيعة OLLI‏ ومجاميعها على نطاق أوسع؛ 
وإيضاح الكيفية التي تتحول فيها هذه ال مجاميع وتتحور مع تطوير بنى تحتية جديدة 
للبيانات. والبيانات ا ممفتوحة» والبيانات الكبيرة؛ والتفكير ا معمق في الآثار المترتبة عن هذه 
المجاميع الجديدة للبيانات فيما يتعلق بكيفية استشعر العام المحيط بنا والتعاطي معه. 
ولتوفير منهاج مفاهيمي وتصور مبدئي أولي. > سيتم في هذا الفصل فحص bul‏ البيانات 
وأطرهاء وطبيعتهاء والقواعد الفلسفية لها بالتفصيل. وبعيداً عن كونها وحدات بنيوية 
بسيظة عمق اللتاققة عن أن البباتات ST‏ عقي دا مما xac‏ ففي حين يقبل 
العديد من المحللين البيانات على ظاهرها. ويعاملونها كما لو أنها محايدة وموضوعية 
وان فقا للتخمين والتحليل في طبيعتهاء إلا أن البيانات مؤطرة في الواقع من الناحية 
الفنية» والأخلاقية, والاقتصادية:. والزمانيةء واممكانيةء والفلسفية. فالبيانات لا هكن أن 
توجد بشكل مستقل عن الأفكارء والأدوات» والممارسات» والسياقات» وا معارف المستخدمة 
لإنتاجهاء وا وتحليلها )2013 dilg .(Bowker 2005; Gitelman and Jackson‏ 
deest E‏ القدمة هي أن فهم السانات وتو o LO‏ الجازية عاك فطلب ااك 
دقة من ذلك الذي تستعرضه الكثير من الأدبيات ذات الصلة بالبيانات اممفتوحة والبيانات 


الكبيرة في وقتنا الحاضر. 


yy‏ ثورة البيانات البيانات الكبيرة» والبيانات المفتوحة» والبنى التحتية للبيانات» والنتائج المترتبة عنها 


تصور لمفهوم البيانات 


ماهية البيانات: 
بشكل اشتقاقيء فإن كلمة البيانات «Data»‏ مشتقة من الكلمة اللاتينية «Dare»‏ 
التي تعني «أن تعطي». وبهذا ا معنى» فإن البيانات هي عناصر خام هكن استخراجها من 
أو تعطى بواسطة ظاهرة معينة يجري قياسها وتسجيلها بطرق مختلفة. ولكن البيانات 
تشر في الاستخدام العام إلى تلك العناصر التي تؤخذ وتستخرج من خلال املاحظات» 
والحسابات» والتجارب» وحفظ السجلات )2007 (Borgman‏ أما من الناحية الفنية, 
فما نفهمه من بيانات أنها في الواقع التقاطات «Capta»‏ والمشتقة من الكلمة اللاتينية 
«Capere»‏ والتي تعني «الأخذ»؛ أي تلك الوحدات من البيانات التي تم اختيارها 
وانتقاؤها من مجموع كل البيانات ال محتملة )2011 .(Kitchin and Dodge‏ كما قال 
ix :1950)‏ مقتبس من Becker 1952: 278) Jensen‏ : 
كان balo‏ مسقا 2 التاريخ أن يستخدم المصطلح بيان Jas «Datum»‏ من 
مصطلح لقطة «Captum»‏ للدلالة على وصف وحدة الظاهرة في العلوم, وهي 
ليست المناولات العلمية التي منحتها الطبيعة للعام» ولكن المناولات التي أخذت 
أو انتقيت من الطبيعة من قبل العالم نفسه às‏ لهدفه. 
من ثم» وبال معنى الدقيق للكلمة» ينبغي على الكتاب أن يُعنون بثورة اللقطة 
.«Ihe Capta Revolution»‏ ومع ذلك ولأن مصطلح البيانات «Data»‏ قد أصبح 
متأصلاً في لغة الاستخدام الأكاديمي وقطاع الأعمال لتعني اللقطة «Capta»‏ وبدلا 
من الخلط واللغط أكثر في هذه المسألة فمن المنطقي المتابعة والاستمرار في استخدام 
مصطلح البيانات «Data»‏ مع أن اعتماد مصطلح اللقطة jS] «Capta»‏ ملائمة في 
الاستخدام. وبعد تجاوز تسليط الضوء على جذور الاشتقاق اللغوي لهذا المصطلح» 
فإن هذه المناقشة الوجيزة تبدأ في تسليط الضوء على أن البيانات التي يتم جمعها 
من خلال القياس هي Lela‏ لمجموعة منتقاة من مجموع كل البيانات المحتملة - 
والتي اخترنا التقاطها من كل المعطيات الممكنة. وعلى هذا النحوء تكون البيانات 
جزثية بطبيعتهاء انتقائية» وممثلة. مع أهمية ال معايير المميزة ا مستخدمة في التقاطها. 


ثورة البيانات البيانات الكبيرة» والبيانات ärgh‏ والبنى التحتية للبيانات» والنتائج المترتبة عنها yy‏ 


الفصل الأول 


وقد لاحظ علماء آخرون أن ما تم فهمه على أنه «البيانات» قد تغير مع مرور الزمن 
وتطور العلم. فقد بين )2013 (Rosenberg‏ بأن مصطلح «البيانات» استخدم لأول مرة 
باللغة الإنجليزية في القرن السابع عشر. وارتبط كمفهوم إلى حد كبير بالحداثة والنمو 
والتطور المصاحب للعلوم» والطرق الجديدة في إنتاج» وعرضء ومناقشة ال معرفة في القرنين 
السابع عشر والثامن عشر والتي انتقلت بعيداً عن اللاهوت» والوعظء والعواطف إلى 
الحقائق والأدلة واختبار النظرية من خلال التجربة ;2013 (Poovey 1998; Garvey‏ 
Rosenberg 2013)‏ ومع مرور الوقت» جاء فهم البيانات على أنها سابقة للتحليلء 
وهي ما قبل اتخاذ صفة الواقعيةء وتختلف في طبيعتها عن الحقائق, والأدلةء وا لمعلومات, 
وا معرفة» ولكنها paie‏ مؤسس في تكوين جميع هذه العناصر على «e£ JI‏ في الغالب» من 
اختلاط التعاريف وال مصطلحات المستخدمة في وصف OLLI‏ الحقائق» الأدلةء المعرفة, 
والمعلومات بحسب ما أشار إليه )18 :2013 (Rosenberg‏ حين ذكر أن: 


الحقائق وجودية (Ontological)‏ والأدلة معرفية (Epistemology)‏ 

والبيانات بلاغية .(Rhetorical)‏ وتكون وحدة البيان «Datum»‏ حقيقة daj‏ 

كما قد تكون الحقيقة في واقع الأمر دليلاً.... على أن وجود وحدة البيان «Datum»‏ 

يعد مستقلاً دون أي اعتبار للحقيقة الوجودية المقابلة Corresponding)‏ 

.(Ontological Truth‏ وعند نفي الحقيقة وإثبات عدم صحتهاء فإنها تتوقف 

عن كونها حقيقة. فالبيانات الكاذبة هي بيانات مع ذلك. 

وبحسب المصطلحات /التعابير البلاغية» فالبيانات هي تلك التي توجد قبل النقاش أو 
التفسير الذي يحولها إلى olg «35là‏ ومعلومات )2013 (Rosenberg‏ ومن هذا المنظورء 
تحمل البيانات مفاهيم مميزة: فهي تكون بذلك 83,2 ومنفصلةء وتراكمية oce)‏ الجمع 
بينها) )2013 (Rosenberg‏ وذات معنى مستقل عن الشكلء واللغة, وامنتج du)‏ والسياق 
(بمعنىء أن تحمل البيانات معناها سواء تم تخزينها بصورة تناظرية (Analog)‏ أو رقمية 
(Digital)‏ أو تم عرضها على الورق أو الشاشة أو تم التعبير عنها بأية ds‏ أو تم تقييدها 
blb‏ محددة غير متغيرة. مثل إشارة عدد الحلقات في جذوع الأشجار لعمر الشجرة والذي 
يكون دوماً مساوياً له) )2010 .(Floridi‏ ويؤكد )2008 (Floridi‏ أن دعم استقلال البيانات 
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تصور لمفهوم البيانات 


قائم على ثلاثة أنواع من الحيادية هي: التصنيفية (Taxonmic)‏ كون البيانات تمثل كيانات 
علائقية معرفة jasied‏ بالنسبة إلى بيانات خاصة أخرى؛ والطوبوغرافية (Typological)‏ 
لأنه هكن للبيانات اتخاذ أشكال مختلفة منفصلة بعضها عن بعضء على سبيل «JULI‏ 
الشكل الأساسيء الثانويء الوصفيء التشغيلي, والمشتق؛ والجينية (Genetic)‏ كون البيانات 
تمتلك دلالات مستقلة عن مدى فهمهاء فعلى سبيل «JUI‏ تشكل الهيروغليفية على حجر 
الرشيد بيانات بغض النظر عن حقيقة أنه عند اكتشافه م يمكن لأحد أن يفسرها. 

وفي واقع الأمر ليس كل من يفكر أو يشتغل بالبيانات يحمل هذه النظرة البلاغية 
الضيقة. ففهم البيانات لم يتطور مع مرور الوقت فحسب» بل اختلف هذا الفهم بحسب 
منظور الفهم ووجهة النظر للبيانات. على سبيل «JULI‏ أوضح )2008 (Floridi‏ أن البيانات 
من المنظور المعرفي هي مجموعات من الحقائقء ومن ا منظور ال معلوماني البيانات هي 
معلومات» ومن منظور الحوسبة التقنية البيانات هي مجموعات من العناصر الثنائية التي 
يمكن معالجتها ونقلها إلكترونياء ومن المنظور العام (Diaphoric)‏ البيانات هي عناصر 
مجردة بتميز واضح وملموس من البيانات الأخرىء ففي الحالة الأولى» توفر البيانات الأساس 
مزيد من الاستدلال أو تشكل الأدلة التجريبية. وف ال مجموعة Ao‏ تشكل البيانات 
معلومات تثيلية /ممثلة هكن تخزينها ومعالجتها وتحليلهاء ولكن لا تشكل بالضرورة 
حقائق. أما في المجموعة AILI‏ فتشكل البيانات المدخلات والمخرجات من الحوسبة ولكن 
ينبغي معالجتها لتحويلها إلى حقائق ومعلومات على سبيل «JULI‏ يحتوي القرص الرقمي 
المدمج (DVD)‏ على غيغابايت من البيانات» وهي ليست وقائع أو معلومات بحد ذاتها 
(Y «0 «53 2913)‏ ف المنظور qul JI‏ تكون البيانات ذات مغزى لأنها التقاط ودلالة على 
التنوع والتغيير على سبيل «JULI‏ أنماط من النقاطء والحروف الأبجدية والأرقام, وا موجات 
الطولية التي تقدم إشارة يمكن تفسيرها. وكما هو مبين «ool‏ قد يشمل فهم البيانات 
مناظير أخرى مثل الفهم القائم ue‏ اغفباز البياناك يناف ez‏ أو zal‏ البزانات 12525 
TNT‏ أو تحميلها مضامين إيديولوجية» أو اعتبارها سلعة يتم تداولها الاتجار بهاء أو أنها 
تشكل منفعة عامة» وغير ذلك من المفاهيم الموجودة. والنقطة الأساسية هناء أن البيانات 
م تكن أبدا ببساطة مجرد بيانات. حيث تختلف الكيفية التي يتم فيها تصور البيانات 
واستخدامها من قبل أولئك الذين يجمعونء ويحللون» ويستخلصون النتائج منها. 
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الفصل الأول 


أنواع البيانات: 

سواء كانت البيانات بطبيعتها قابلة للتخمين (تم التكهن قبل التحقق منها) ومطابقة 
بلاغيا أو Y‏ فمن الواضح أن البيانات متنوعة في خصائصهاء مما يحذد بعبارات واضحة 
كيفية التعامل معها وما مكن القيام به من خلالها. وبصفة عامة» تختلف البيانات بحسب 
النموذج (النوعي el‏ الكمّي)» والهيكل (المنظم» أو شبه المنظم, أو الغير منظم)» وا مصدر 
(مسجلة: zia el‏ أم مستنفذة أم عابرة)» والمنتج (رئيسيء أو ثانوي» أو elele‏ والنوع 
(بيانات doux‏ أو بيانات خاصية. أو بيانات وصفية). 


البيانات الكمية (Quantitative Data)‏ والبيانات النوعية :(Qualitative Data)‏ 
من الممكن أن تتخذ البيانات العديد من الأشكال المادية متضمناً ذلك الأرقام, والنصوص, 
والرموزء والصورء والصوت. والموجات الكهرومغناطيسية» أو حتى الفراغ أو الصمت (فالفضاء 
الفارغ هو في i>‏ ذاته بيانات). وتنقسم هذه البيانات في العادة إلى فئتين رئيسيتين: 
البيانات الكمية والبيانات النوعية» فالبيانات الكمية تتكون من سجلات رقمية. وبشكل عام 
تكون هذه البيانات واسعة النطاق وتتعلق بالخصائص الفيزيائية للظواهر (مثل الطولء 
الارتفاع» المسافة, الوزن» Ao Lll‏ والحجم). أو تكون تمثيلية وتتعلق بالخصائص غير المادية 
للظواهر (مثل الطبقة الاجتماعيةء المستوى التعليمي» الحرمان الاجتماعي» وتصنيفات 
مستوى المعيشة). وللبيانات الكمية أربعة مستويات مختلفة للقياس والتي تحدد كيفية 
Lytis‏ وقعليليا )1999 «Kitchin and Tate‏ وانظر أيضا الجدول ١دا‏ ومكن ddes‏ 
هذه البيانات باستخدام العروض المرئية» ومجموعة متنوعة من طرق الإحصاء الوصفي 
والاستدلالي» وتستخدم باعتبارها مدخلات للنماذج التنبؤية ونماذج المحاكاة. 
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تصور لمفهوم البيانات 


غير متزوج» متزوج» مطلق» 
أرمل 


درجة الحرارة 
على المقياس ال مئوي 


.(Celsius scale) 


علامة الاختار على قياس 
من صفر- ٠٠١‏ 


الجدول )5-5( 


مستويات قياس البيانات 


فق وحدات قياس منفصلة. 


ترتب المشاهدات في فئات منظمة. حيث 
بعض المشاهدات هي أكبر من غيرها. 


تمتد القياسات على طول مقياس يتضمن 
الفترة أو المسافة بين نقطة أصل ثابته 
وأخرى متغيرة. ولا تتغير طبيعة فترة 
المشاهدات في هذا النوع من القياسات 
عند الإضافة أو المضاعفة مقدار ثابت. 
ويمكن أن تكون قيمة البيانات متصلة 
(على سبيل الممثال» الوقت أو الطول) أو 
منفصلة /متقطعة (على سبيل «JULI‏ عدد 
مرات المشاهدة) في الطبيعة. 

مماثلة لبيانات الفترة عدا أنها ذات 
نقطة أصل صفرية حقيقية. كما أن 
المضاعفة بمقدار ثابت لن تغير الطبيعة 
النسبية للمشاهدة. 


البيانات الاسمية 
البيانات النظامية الترتيبية 
(Ordinal data)‏ 


بيانات الفترة (أو المسافة) 
(Interval data)‏ 


البيانات النسبية 
(Ratio data)‏ 





وف «lll‏ فإن البيانات النوعية هي بيانات غير عددية» مثل النصوص, الصورء الفنء 
القيديق الأصوات: والموسيقا. وبرغم أنه من تحويل النيانات التوعية إل Aas Ulo‏ 
إل a‏ ذلك شمن Léa‏ وتعريدا dias ces d Uo SEGUI Cales Dus‏ 
التحويل. ولذاء فإن عملية تحليل البيانات النوعية تمارس في العادة على المواد الأصلية: سعيا 
لاستخلاص وبناء ا معنى والفهم بدلا من إخضاع البيانات ومجرد إمرارها لتقنيات حاسوبية. 
ومع ذلك فقد تم إحراز تقدّم كبير فيما يتعلق بمعالجة وتحليل البيانات النوعية حاسوبياً 
من خلال عدد من التقنيات مثل التعلم الآلي والتنقيب في البيانات (انظر الفصل السادس). 
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الفصل الأول 


البيانات المنظمة «(Structured Data)‏ والبيانات غير المنظمة «(Unstructured Data)‏ 
والبيانات الشبه المنظمة :(Semi-structured Data)‏ 

البيانات المنظمة هي تلك البيانات التي هكن تنظيمهاء وتخزينهاء ونقلها بسهولة من خلال 
pet‏ بيانات محدد, مثل قائمة الأرقام والنصوص الواردة في جدول أو قاعدة بيانات علائقية 
ذات تنسيق ثابت موحد (على سبيل «JULI‏ الاسم تاريخ الميلادء العنوان» الجنس.... إلخ). 
ويمكن ids‏ هذه البيانات. والبحث فيهاء والاستعلام عنهاء والجمع بينهاء وتحليلها بشكل 
اشر سيا elata‏ ساب التفاضل والتكامل والخواززميات» كما مكن base lalak‏ 
باستخدام أشكل مختلفة من الرسومات البيانية والخرائط» ومعالجتها بسهولة من قبل 
أجهزة الحاسب الآلي. أما البيانات الشبه المنظمة فهي بيانات ذات تنظيم/ هيكل فضفاض 
ولیس لها نموذج أو مخطط مسبق» ومن ثم لا هكن تقيبدها ضمن قاعدة بيانات علائقية. 
وتكون بنية البيانات الشبه المنظمة غير متسقة. وضمنيةء yas‏ وغالبا ما تتداخل في 
شبكة ذات شكل هرمي» ولكنها في ذات الوقت تتمتع مجموعة متسقة بشكل كبير من 
حقول البيانات» ويتم تمييز كل منها بوسم مميزء ومن ثم GLE‏ فصل المحتوى بصورة دلالية 
وتوفير بيانات وصفية ذاتية التعريف بصورة مرنة واستخدامها وسيلة لفرز وترتيب وهيكلة 
البيانات. ومن الأمثلة على البيانات شبه ال منظمة صفحات الويب الموسومة بلغة التوصيف 
اموسعة (Extensible Markup Language- XML)‏ وهي الصفحات التي تستخدم لغة 


التوصيف املوسعة (XML)‏ لتنسيق وترميز ا مستندات بصورة ؛ قابلة للقراءة ET Ur‏ 2 
ol‏ واحد؛ 2012 ‘Franks‏ انظر البيانات المرتبطة في الفصل الثالث). 


في «ttl‏ لا تمتلك البيانات غير المنظمة نموذج بيانات hadas‏ أو هيكلا تعريفياً مشتركا. 
ولكن قد يكون لكل paie‏ على حدة شكل أو هيكل محدّد خاص به مثل عناصر النص 
(ilo JI‏ أو الصورةء ولكن ليس كل البيانات ضمن مجموعة البيانات لها الهيكل نفسه. 
على هذا النحوء وبينما يمكن في الغالب البحث والاستعلام عن البيانات غير المنظمة: إلا 
أنه ليس من السهل الجمع بينها وتحليلها باستخدام الحاسب الآلي. وتكون البيانات غير 
ا لمنظمة نوعية بطبيعتهاء ولكن من ا ممكن في أغلب الأحيان تحويلها إلى بيانات منظمة 
مسق خلال الفرز الصيف وى وقت قريب فما كانت مجموعات اليانات الكيرة 
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جداً تحوي في العموم بيانات منظمة كونها أسهل بكثير في المعالجة والتحليل والتخزين 
على هذه الحال. أما في عصر البيانات الكبيرةء فقد تكونت العديد من مجموعات البيانات 
الضخمة التي تحوي بيانات شبه منظمة أو غير منظمةء مثل التي أنتجتها المشاركات 
الاجتماعية الجماعية على مواقع التواصل الاجتماعي مثل الفيسبوكء التغريدات على تويتر 
الصور ومقاطع الفيديو ا مرفوعة على الشبكة العامميةء والمدونات ò| (Blogs)‏ تشير بعض 
التوقعات إلى معدل زيادة في نمو هذه البيانات غير المنظمة أو الشبه المنظمة مقدار خمسة 
عشر Uis‏ عن البيانات ال منظمة )2012 (Zikopoulos et al.‏ وقد صاحب ذلك تطور 
في تصميم قواعد البيانات مثل قواعد البيانات غير العلاقية (NoSQL)‏ والتي لا تستخدم 
النماذج الجدولية أو قواعد البيانات العلائقيةء انظر الجدول رقم 0( وتقنيات التعلم QI‏ 
التي تساعد في التخزين والتحليل (انظر الفصل السادس). 


البيانات الملتقطة (Captured Data)‏ والبيانات المستنفدة/ المستهلكة 
«(Exhaust Data)‏ والبيانات العابرة (Transient Data)‏ والبيانات المشتقة / 
المستمدة :(Derived Data)‏ 

هناك طريقتان رئيسيتان لإنتاج البيانات: الأولى هي أنه من ال ممكن الحصول على 
البيانات بصورة مباشرة من خلال شكل من أشكال القياس مثل الملاحظة: والمسح اطيداني» 
والتجارب المخبرية والميدانيةء وحفظ السجلات (على سبيل JEL‏ ملء الاستمارات أو كتابة 
المدونات)» والكاميرات» والماسحات الضوئيةء وأجهزة الاستشعار. وفي هذه الحالات» عادة 
ما تكون البيانات هي المنتج المطلوب للقياس؛ أي أن النية هي إنتاج بيانات مفيدة. ds‏ 
المقابل» يتم إنتاج البيانات المستنفدة بالأصل بواسطة جهاز أو el‏ وتكون ناتج وظيفة 
رئيسية وليست المخرج الرئيسي )2011 (Manyika et al.‏ فعلى سبيل «JULI‏ فإن جهاز 
تسجيل الخروج الإلكتروني المصمم لاحتساب إجمالي البضائع التي تم شراؤها ومعالجة 
عملية الدفع لها من الممكن أن ينتج كذلك بيانات تستخدم مراقبة المخزونء وأداء العاملينء 
وعمليات شراء العملاء. guis‏ العديد من الأنظمة المحوسبة مثل هذه البيانات المستنفدة 
والتي أصبح الكثير منها مصدراً قيما للبيانات. وفي حالات أخرىء فإن البيانات المستنفدة 
تبقى بيانات عابرة بطبيعتها؛ أي أنه لم يسبق أن جرى فحصها أو معالجتها ولذا فإنه يجري 
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التخلص منهاء إما لأنها ضخمة جداً أو غير منظمة بطبيعتهاء أو مكلفة في المعالجة والتخزينء 
أو أنه يوجد نقص في تقنيات استخلاص القيمة منهاء أو لقلة الاستخدام الإستراتيجي أو 
SII‏ لها )2012 .(Zikopoulos et al. 2012; Franks‏ ومن الأمثلة على ذلك ما ذكره 
Manyika et al. (2011: 3)‏ من أن "مقدمي خدمات dile JI‏ الصحية.... يتجاهلون XA*‏ 
من البيانات التي ينتجونها (كالفيديوهات المسجلة أثناء العمليات الجراحية)". 


وتعد البيانات الملتقطة والبيانات المستنفدة بيانات «خام» بمعنى أنه م يتمّ تحويلها أو 
ضمّها مع غيرها من البيانات. وف المقابلء يتم إنتاج البيانات المشتقة من خلال عمليات 
إضافية من المعالجة والتحليل للبيانات التي تمّ التقاطها. فعلى سبيل «JULI‏ قد تكون 
البيانات هي تعداد حركة الأفراد على أحد التقاطعات المرورية والبيانات المشتقة منها هي 
التعداد الإجمالي أو التعداد لكل ساعة. فالبيانات الأخيرة استمدت من البيانات السابقة. 
وتكون البيانات التي جرى التقاطها في كثير من الأحيان مدخلا إلى نموذج العملية في حين 
تكون البيانات المشتقة هي المخرج عن نموذج العملية. فعلى سبيل JULI‏ قد تكون بيانات 
الكثافة المرورية مدخلا إلى نموذج النقل والمواصلات على أن يكون المخرج هو بيانات التوقع 
أو المحاكاة (مثل حساب حركة المرور المتوقعة في أوقات مختلفة أو في ظل ظروف مختلفة). 
ففي حال وجود نموذجء من المرجح أن تضم بيانات التعداد/ الكثافة المرورية مع بيانات 
أخرى ملتقطة أو مشتقة (مثل نوع السيارةء وعدد الركاب... إلخ) لإنشاء بيانات مشتقة 
جديدة قد تشكل مدخلا للنموذج. ويتمٌ إنتاج البيانات المشتقة لعدة Le obe ad‏ فيها 
الحدٌ من حجم البيانات والتقليل منها إلى قدر مقبول من الممكن إدارته لإنتاج مقاييس 
أكثر فائدة وذات معنى. وفي بعض الأحيان» قد تتم معالجة البيانات الأصلية الملتقطة إلى 
مستويات مختلفة من الاشتقاق اعتماداً على الاستخدام المقصود. ويُعد نظام وكالة الفضاء 
الأمريكية - ناسا الخاص برصد ومراقبة الأرض من الأمثلة على ذلك حيث يقدم بياناته في 
ستة مستويات تبدأ من البيانات الملتقطة وغير المعالجة: وتمضى خلال درجات متزايدة 
من مستويات ال معالجة والتحليل وصولاً إلى مخرجات النموذج القائمة على تحليل بيانات 
ا مستوى الأقل )2007 ‘Borgman‏ انظر جدول (V-Y‏ 
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الجدول )5-7( 


المستويات الستة لبيانات نظام رصد ومراقبة الأرض الخاص بوكالة الفضاء الأمريكية 


مستوى البيانات 


امستوى بيانات غير منظمة» وغير معالجة بالدقة الكاملة وبالحالة الخام وتحوي 
كافة إضافات بيانات الاتصالات (على سبيل المثالء بيانات التزامن» 
ترويسة الاتصالء البيانات المكررة) 

المستوى الأول أ بيانات غير منظمة: وغير معالجة بالدقة الكاملة. ولكن معنونة زمانياً 
ومذيّلة أو متبوعة بشروحات إضافية, تشمل معاملات معايرة ومقاييس 
راديوية وجغرافية ومؤشرات تحتسب وتضاف للبيانات في المستوى ٠‏ 
ولكن لا تطبق عليها. 


هي بانات المستوى الأول أواكن تن Jasa ches een‏ 


الأول 
المستوى الثالث Col ite‏ ت شعييدها ق قاس dale dS, b‏ لف Oel‏ ىق 
Bola‏ مع عض cAGS‏ والتدقيق على lazo‏ 


المستوى الرابع مخرج النموذج أو النتائج من التحليل لبيانات المستويات الأقل 
(المتغيرات المشتقة من قياسات متعددة). 


المصدر: مقتبس من اللوقع الإلكتروني على العنوان : 


https://earthdata.nasa.gov/data/standards-and-references/processing-levels 
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«(Secondary Data) البيانات الثانوية‎ (Primary Data) البيانات الرئيسية‎ 
(Tertiary Data) والبيانات العامة‎ 

يتم إنتاج البيانات الرئيسية (الأساسية) من قبل الباحثين وأدواتهم من خلال تصاميم 
البحوث التي يضعونها. أما البيانات الثانوية فهي البيانات التي يتم إنشاؤها من قبل 
شخص ثم تتاح للآخرين لإعادة استخدامها وتحليلها. وعلى ذلك» يمكن أن تكون البيانات 
الأساسية لشخص ما هي بيانات ثانوية عند شخص آخر. أما البيانات العامة فهي شكل من 
أشكال البيانات «Ail‏ مثل التعدادء والفئات, والنتائج الإحصائية, وتصدر البيانات العامة 
غالبا من قبل الوكالات الإحضافية. يدل فق البيانات القانوية لضان الم تالاق حاص 
الذين تشير ead]‏ هذه البيانات. على سبيل «JUL‏ يحظر نشر البيانات الأساسية للتعداد 
السكاني الأيرلندي على أنها بيانات ثانوية إلا بعد مائة عام من إنتاجها؛ ولكن يتم الإفراج 
عن البيانات على صورة ملخصات إجمالية وبيانات تصنيفية عامة. ويسعى العديد من 
الباحثين والمؤسسات لإنتاج اليانات الأبناسية li‏ فص Laus‏ لاحتياجاتهم الخاصة 
ومركز عليهاء في حين لا تتوفر خيارات التصميم هذه لأولئك الذين يقومون على تحليل 
البيانات الثانوية أو العامة. وعلاوة على ذلك» على أولئك الذين يستخدمون البيانات 
الثانوية والعامة كمدخلات في دراساتهم الخاصة أن يتوثقوا من صلاحية البحث الأصلي 


وصحته. 


ويجمع الباحثون في كثير من الأحيان بين البيانات الأساسية والبيانات الثانوية والعامة 
لإنتاج بيانات مشتقة ذات قيمة أكبر. على سبيل JELI‏ قد تسعى متاجر التجزئة لإنشاء 
مجموعة بيانات مشتقة تدمج بيانات المبيعات الأساسية مع البيانات السكانية الجغرافية 
العامة (Tertiary geodemographics data)‏ وهي بيانات عن أي نوع من الناس الذين 
يعيشون في مناطق مختلفة والمستمدة من التعداد السكاني والبيانات العامة والتجارية 
الأخرى من أجل تحديد أماكن لاستهدافها بالمواد التسويقية. إن البيانات الثانوية والعامة 
ذات قيمة لأنها osé‏ من إجراء الدراسات التكرارية وبناء مجموعات بيانات أكبر bas‏ 
وأكثر ثراء و وهي تنتج لاحقاً ما أطلق عليه )2012 (Crampton et al.‏ مصطلح 
تضخيم البيانات Amplification)‏ 2 والذي يعني أن الجمع بين البيانات يتيح رؤى 
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أكبر بكثير من خلال الكشف عن الروابطء العلاقات» والأنماط التي تبقى خافية في حال 
ظلت البيانات معزولةء ونتيجة EUU‏ فإن بيانات السوق الثانوية والعامة هي صناعة 
مليارات الدولارات (انظر الفصل (Y‏ 


البيانات التأشيرية «(Indexical Data)‏ البيانات الخاصية «(Attribute Data)‏ 
والبيانات الوصفية :(Metadata)‏ 

essc es‏ أيضا في النوع. فالبيانات التأشيرية هي تلك البيانات التي تتيح 
التعريف بالبيانات وربطها بغيرها من البيانات I‏ 8,2« وتشمل معرّفات فريدة من نوعهاء 
مثل أرقام جوازات السفر وبطاقات الضمان الاجتماعيء وأرقام بطاقات الائتمانء والأرقام 
التسلسلية امصنعة» ومعرفات الكائن الرقميء وعناوين الربط الشبي (IP and MAC)‏ 
وأرقام الشحن وطلبات الشراءء إضافة إلى الأسماء والعناوينء والرموز البريدية. إن البيانات 
التأشيرية مهمة لأنها تساعد في حصر كميات كبيرة من البيانات غير ا مفهرسة بعضها مع 
بعض وتتبعها من خلال معرّفات مشتركة» والمساعدة على التمييز بينهاء وضمهاء وتقسيمها 
وإعادة تجميعهاء والبحث فيها وغيرها من JS Ca]‏ المعالجة والتحليل. وكما هو مبين في 
الفصل aol JI‏ فقد أضحت البيانات التأشيرية شائعة على نحو متزايد وبصورة متخصصة, 
مما يزيد من درجة الارتباط والعلائقية بين مجموعات البيانات. أما البيانات الخاصية 
فهي بيانات تمثل جوانب من الظاهرةء ولكنها ليست تأشيرية بطبيعتهاء وعلى سبيل «JUL‏ 
بالنسبة إلى شخص ماء قد تكون البيانات التأشيرية هي بصمات الأصابع أو تسلسل الحمض 
النووي (DNA)‏ وقد تكون بيانات الخاصية له مثل العمرء الجنس» الطول» الوزنء لون 
العينين» فصيلة الدم» وغيرها. مع ملاحظة أن الغالبية العظمى من البيانات التي يتم 
إنشاؤها وتخزينها في الأنظمة هي بيانات الخاصية. 

البيانات الوصفية هي بيانات عن البيانات» ويمكن أن تشير البيانات الوصفية إلى 
محتوى البيانات أو مجموعة البيانات كاملة. وقد تشمل البيانات الوصفية عن المحتوى 
أسماء ووصف حقول بيانات محددة على سبيل JUL‏ رؤوس الأعمدة في جدول البيانات 
وتعريفات البيانات. وتساعد هذه البيانات الوصفية مستخدم مجموعة البيانات على 
فهم مكونات البيانات وتركيبتها وكيف ينبغي استخدامها وتفسيرهاء وتساعد في الدمج بين 
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مجموعات البيانات» وقابلية التشغيل البيني وتبادل البيانات بينهاء والاكتشاف» والقدرة 
على الحكم على مصدر البيانات وسندها. أما البيانات الوصفية التي تشير إلى مجموعة 
البيانات كلها فلها ثلاثة أشكال )2004 .(NISO‏ فالش كل الأول يتعلق بالبيانات الوصفية 
التوضيحية والتي تشير إلى بيانات التحديد/التعريف والاكتشاف المتعلقة بمجموعة 
البيانات» وتشمل عناصر مثل الاسم. والمؤلفء والناشرء والموضوع. والوصف. ويتضمن 
الشكل الثاني البيانات الوصفية الهيكلية والتي تشير إلى بيانات التنظيم والتغطية لمجموعة 
البيانات. ويحتوي الشكل الثالث البيانات الوصفية الإدارية التي تعكس متى وكيف تم 
إنشاء مجموعة البيانات» وتفاصيل الجوانب الفنية للبيانات» مثل صيغة تنسيق الملف»ء 
ومن الذي هملك وله صلاحية استخدام البيانات. ومن المعايير الشائعة للبيانات الوصفية 
والذي يجمع الأنواع الثلاثة للبيانات الوصفية معيار دبلن كور Dublin Core) (http://)‏ 
.(dublincore.org‏ ويشترط هذ المعيار قتع مجموعة البيانات بخمسة عشر عند 
للبيانات الوصفية هي : العنوانء ال منشىء» الموضوع» الوصفء الناشر, المساهم. التاريخ» 
النوع: الصيغة. المعرّفء المصدرء واللغة. العلاقةء التغطية / النطاق» والحقوق / الصلاحيات. 
وبرغم أن البيانات الوصفية تعد أحد المكونات الأساسية لكافة مجموعات البيانات» إلى 
أنه يجري إهمالها في ممارسات دعم الإتاحة وإعادة الاستخدام والمشاركة للبيانات Data)‏ 
(Curation‏ وخصوصا من الباحثين الذين يجمعون البيانات الأساسية لاستخدامهم الخاص 
دون مشاركة الآخرين بها. 


(Knowledge) والمعرفة‎ (Information) والمعلومات‎ (Data) البيانات‎ 
:(Wisdom) والحكمة‎ 

ما يوحد الأنواع المختلفة من البيانات التي تم التطرق إليها في الأجزاء السابقة هو 
أنها تشكل القاعدة أو الأساس الذي يقوم عليه هرم المعرفة: فالبيانات تسبق المعلومات, 
والمعلومات تسبق المعرفة: والمعرفة تسبق الفهم والحكمة Adler 1986; Weinberger)‏ 
1. وتتميز كل طبقة من الهرم من خلال عملية التقطير (التقليلء التلخيص «X yel‏ 
المعالجة والتجهيزء التنظيم» التحليل» التنفسيرء والتطبيق) التي تضيف التنظيم؛ ال معنىء 
والقيمة من خلال الكشف عن العلاقات والحقائق حول العام (انظر الشكل .)١-١‏ 
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do‏ حين أن ترتيب المفاهيم داخل الهرم هو لا جدال فيه على العموم» إلا أن طبيعة 
المفاهيم والاختلافات lazo‏ كثيراً ما تختلف بين المدارس الفكرية. فا معلومات. على سبيل 
«JULI‏ هي المفهوم الذي يفهم على نحو مختلف بين العلماء فبالنسبة للبعضء ا معلومات 
هي تراكم البيانات المرتبطة بهاء وبالنسبة للآخرين هي البيانات إضافة للمعنىء أو الإشارة 
ذات المعنى في ضوضاء البيانات» أو البناء متعدد الأوجه» أو البيانات العامة حيث تم 
إعادة صياغة البيانات الأساسية من خلال نموذج تحليلي. فبالنسبة لعام الفيزياء البيانات 
هي مجرد سلسلة من الأصفار والآحاد, أي (Bits)‏ خام؛ وتعد ضوضاء .(Noise)‏ ولذلك 
فإن ال معلومات بالنسبة لعام الفيزياء تتكون عندما يتم تنظيم هذه الأعداد من الصفر 
والواحد Pul à‏ متميزة؛ فهذه هي الإشارة المفيدة )2003 .(von Baeyer‏ فموجات 
الأثير وكابلات الاتصالات هي ممتلئة بالمعلومات المتدفقة - كإشارات الراديو والتلفاز 
والمحادثات الهاتفية وحزم بيانات شبكة الانترنت - التي تعني أنماطا ذات مغزى من 
البيانات ضمن حزمة أوسع من الضوضاء. وبالنسبة لآخرين. فال معلومات ذات مفهوم 
أوسع. فقد حدّد )74 :2010 (Floridi‏ على سبيل (JULI‏ ثلاثة أنواع من المعلومات : 
٠‏ الواقعية (Factual)‏ معلومات تعكس الحقيقة (على سبيل المثالء الأنماطء بصمات 

lol‏ وحلقات جذوع الأشجار). 


« التعليمية :(Instrucional)‏ معلومات d‏ الحقيقة (على سبيل JELI‏ الأوامرء 
الخوارزميات. والوصفات). 

« الدلالية :(Semantic)‏ معلومات عن الحقيقة (Ae)‏ سبيل «JUL‏ الجداول الزمنية 
للقطارات» الخرائطء والسير الذاتية). 
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)١-١( شكل‎ 


هرم المعرفة (منقول من 2010 (Adler 1986 and McCandless‏ 





فالنوع الأول هو أساساً بيانات ذات معنى» وهو ما يطلق عليه عادة الحقائق. وهي 
eb‏ التي يتم تنظيمها وتركيبها ضمن نظام قياس أو مرجع عار وو سوه 
أساسا لإنشاء المعنى الأولي الذي يحمل بعض الحقيقة. وتمتد ال معلومات أيضا إلى ما 
بعد البيانات والحقائق من خلال إضافة قيمة تساعد على التفسير. وعليهء أوضح 
(Weinberger 2011: 2)‏ أن : "ال معلومات بالنسبة للبيانات» كالنبيذ بالنسبة لحقل 
العنب: استخراج نواتج التقطير اللذيذة! ". ولذا هكن الحصول على هذه القيمة من 
خلال فرز وتصنيف» وربطء وإضافة المحتوى الدلالي من خلال بعض الشكل النصي أو 
الصوري والذي يشير إلى شيء ما و/ أو يرشد إلى ما ينبغي القيام به (على سبيل JGL‏ 
الإشارة الضوئية التحذيرية على لوحة معلومات مؤشرات عمل السيارة التي تشر إلى 
فراغ البطارية وحاجتها لإعادة الشحنء 2010 .(Floridi,‏ وقد oi;‏ (2002: ملخصاً في 
Borgman 2007: 40) Case‏ أن الاختلافات في تعريف ال معلومات تتوقف على خمس 
مسائل: 
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عدم اليقين (Uncertainty)‏ أو ما إذا كان شيء ما قد يحد من عدم اليقين 
في تأهيل البيانات لتكون معلومات؛ المادية (Physicality)‏ أو ما إذا كان 
شيء ينبغي أن يؤخذ على شكل مادي مثل «OUS‏ أو كائن» أو موجات صوتية 
لكلمة خطيب لتأهل البيانات لتكون معلومات؛ البنية / العملية Structure/)‏ 
gf «(Process‏ ما إذا كان يلزم مجموعة من الترتيبات أو العلاقات؛ القصد والعزيمة 
(Intentionality)‏ أو ما إذا كان شخص ما قد أوعز Ob‏ شيئا ما تم التواصل معه 
ليتأهل ليكون معلومات؛ والحقيقة (Truth)‏ أو ما إذا كان ينبغي أن يكون 
الشيء صحيحا للتأهل ليكون معلومات. 
وبغض النظر عن كيفية تصور US‏ فقد لاحظ )2010 (Floridi‏ أنه بالنظر إلى إضافة 
المعلومات المعنى إلى البيانات» فهي تكتسب القيمة الربحية كسلعةء غير آنهاء كنوع متميز 
من السلع» تمتلك ثلاثة خصائص رئيسية مميزة (والتي تتميز بها البيانات أيضا): 
غير تنافسية ) :(Non-rivalrous‏ حيث من الممكن لأكثر من مستخدم أن elg‏ نفس 
المعلومات دون التأثير على مدى استفادة اللمستخدمين الآخرين منها (على عكس السلع 
المادية المستهلكة). 
غير قابلة للاستثناء أو الإقصاء :(Non-excludable)‏ حيث يتم تقاسمها ومشاركتها 
بسهولة ويلزم بذل جهد كبير في السعي dU‏ من مثل هذه المشاركة (مثل فرض اتفاقيات 
حقوق الملكية الفكرية أو إضافة حواجز الدفع (Paywalls)‏ قبل الاستخدام). 
التكلفة الهامشية :(Zero Marginal Cost)‏ مجرد إتاحة المعلومات من المرة «VI‏ 
فإن تكلفة الاستنساخ أو إعادة الإنتاج في كثير من الأحيان لا تكاد تذكر. 
ومع التشديد على خصائص كون المعلومات مورد يتميز بعدم المنازعة وعدم الاستثناء 
ولأن المعلومات تعد سلعا قيمة» تسعى العديد من الكيانات لضبطها والحد من تداولها 
والسيطرة lade‏ ومن ثم زيادة قيمتها. ومعظم هذه القيمة تضاف من خلال العمليات 
التي تفرض خلال دورة حياة المعلومات )2010 (Floridi‏ والمشتملة على المراحل التالية: 
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الوجود (Occurrence)‏ الاكتشافء التصميم» التأليف. 
الإرسال :(Transmission)‏ التشبيك, التوزيع» النفاذ. الاسترجاع» النقل. 


امعالجة والإدارة «(Processing and Management)‏ الجمع» التحققء التعديلء 
التنظيم» الفرزء التصنيف. التصفية» التحديث, التخزين. 


الاستخدام :(Usage)‏ الرصد وامراقبة» النمذجة» التحليل» الشرح» التخطيطء التنبؤ 
اتخاذ القرارات» التوجيه» التعليم» التعلم. 
ومن خلال المعالجة والإدارة والاستخدام يتم تحويل المعلومات إلى معرفة أكثر قيمة. 


وكما هو الحال مع جميع المفاهيم في هرم «d$ xl‏ وبا مثلء يختلف فهم مفهوم 
المعرفة. فبالنسبة للبعضء المعرفة هي الدراية التي تحول المعلومات إلى تعليمات 
.(Weinberger 2011: 3)‏ فعلى سبيل «JULI‏ مكن ربط ال معلومات الدلالية إلى وصفات 
وتعليمات Vol)‏ قم dig‏ ثم افعل ذلك..) أو نموذج شرطي لإجراءات استنتاجية BD‏ 
كان الحال هو كذا وكذا فافعل IIS‏ وإلا افعل هذا) )2010 .(Floridi‏ في هذا التأطيرء 
تكون المعلومات هي البيانات الهيكلية» والمعرفة هي معلومات إجرائية قابلة للتنفيذ 
.(Weinberger 2011)‏ وبعبارة آخری» "المعرفة هي الوصفة التي تحول ال معلومات 
إلى الخبز القابل للأكلء بينما البيانات هي العناصر المكونة للدقيق والخميرة" Zelany)‏ 
1987 منقول عن 2011 (Weinberger‏ وبالنسبة للآخرينء فإن المعرفة هي JS]‏ من 
مجرد مجموعة من التعليمات ؛ ويمكن أن تكون المهارات العمليةء وأبعد بكثير عن مجرد 
وسيلة لمعرفة كيفية إجراء أو تحقيق المهمة» أو النظام الفكري الذي يربط بشكل متسق 
ا معلومات مع بعضها البعض للكشف عن صورة أوسع لظاهرة ما. وينطوي إيجاد 
المعرفة على تطبيق العمليات ال معرفية المعقدة على ا معلومات Jie‏ الإدراك» والجمع 
والتركيب» والاستخلاص» والدمج والتكوينء والاستنتاج والربط. وللمعرفة قيمة أكبر من 
قيمة المعلومات لأنها توفر أساسا ead)‏ وتوضيح» ورسم رؤى حول العام» والتي من 
الممكن استخدامها في صياغة السياسات والإجراءات. أما الحكمة. التي تحتل قمة هرم 
ا معرفة. فهي القدرة على تطبيق ا معرفة برجاحة وروية. 
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وبرغم أنه م Lola‏ بثبات علاقة كل أشكال المعرفة بالبيانات» على سبيل JULI‏ التخمين 
والآراء وا معتقدات» إلا أن البيانات تشكل بوضوح Bale‏ القاعدة الرئيسية لكيفية استشعار 
الواقع والعام من حولنا. حيث تشكل البيانات المدخلات الأماسية في العمليات مثل 
الجمع» الفرز التصنيفء المطابقة» التشخيص / التنميطء والنمذجة التي تسعى إلى إنشاء 
المعلومات والمعرفة من أجل فهم الظواهر. والتنبؤ بهاء وضبطها والسيطرة عليها. كما 
Lose‏ إنتاج البيانات بمرور الوقت وف أماكن مختلفة من qu‏ وتقييم» ومقارنة الظواهر 
عبر الأزمنة والأماكن والنطاقات. وهكذاء وعلى الرغم من أنه a‏ إلى ا معلومات والمعرفة 
إلى كونها مفاهيم ذات درجة أعلى وقيمة cS]‏ تبقى البيانات. مع فلك عتضرا أسانسياً يا مع 
قيمة كامنة كبيرة يجرى إدراكها وتحصيلها عند تحويلها إلى معلومات ومعارف. فالدافع 
المنطقي الرئيسي لحركة البيانات ال مفتوحة» والتي بحثت في الفصل الثالث» هو القدرة على 
الوصول إلى القيمة الكامنة في مجموعات بيانات القطاعات الإدارية والعامة. 


تأطير البيانات :(Framing Data)‏ 
حتى الآن في هذا haill‏ فقد بدأت بالفعل صياغة البيانات من الناحية النظرية من حيث 
مناقشة أنطولوجيا البيانات (ماهية (Losses‏ وأشكالها المختلفة, وأين تتموضع داخل هرم 
ا معرفة. كما أن هناك عدداً لا يحصى من الطرق الأخرى التي هكن بها فهم البيانات والتفكير 
dup‏ على سبيل امثالء من ال منظور التقني الخاص بجودة البيانات» وصحتهاء وموثوقيتهاء 
ونسبتهاء وقابليتها للاستخدام» وكيف هكن معالجتها وتنظيمهاء وتقاسمهاء وتحليلها؛ أو 
من المنظور الأخلاقي المتعلق بالأسباب التي دفعت إلى إنتاج البيانات والاستخدامات التي 

يتم توظيفها بها؛ أو من المنظور السياسي أو الاقتصادي والذي يأخذ بعين الاعتبار التصور 
ا معياري للبيانات ومواضع الطعن والتنازع والتنافس فيها كمنفعة عامة» ورأس مال سياسيء 
وملكية فكرية» أو سلعة تجاريةء وكيف يتم تنظيمها وتداولها؛ أو من المنظور المكاني و/ أو 
الزماني المتعلق بكيفية إنتاج البيانات وتطوير استخداماتها ومحاور تركيزها من قبل الأنظمة 
وا مجموعات التقنية, والأخلاقيةء والسياسية, والاقتصادية عبر المكان والزمان؛ أو من المنظور 
الفلسفي الذي يأخذ بعين الاعتبار المفاهيم المبدئية وا معرفية للبيانات. وسترجع لاستذكار 
العديد من القضاياء التي تم بحثها في هذا القسم» لاحقاً في جميع أجزاء الكتاب ال مقبلة. 
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المنظور الفني :(Technically)‏ 

في جميع التخصصات. يتم أخذ البيانات بعين الاعتبار من وجهة النظر التقنية المعيارية. 
Jl ll‏ المطروج على اللحك هو إل أي مدى qz‏ طرق lil‏ البيانات وقياسها يانات 
محددة. ونظيفة» ودقيقة» وكيف هكن وينبغي doleo‏ وتنظيم» ومشاركة» وتحليل هذه 
CULO‏ بطرق تعاط عن diae‏ من أجل ضبان موو عا deos‏ ال تاجات 
اللستففاضية متها :ولذا كان هثالك Ufo‏ شكوك يما تلق بصبحة البيانات lai‏ بظبيعنها 
مجردة. وعمومية» وتقريبية عند إنتاجها )2009 .(Goodchild‏ وحيث EUS‏ فقد توجه 
الكثير من الاهتمام إلى قضايا تتعلق مفاهيم تمثيل البيانات «(Data representativeness)‏ 
وعدم اليقين بصحتها (Uncertainty)‏ ودرجة الموثوقية بها (Reliability)‏ والأخطاء 
ا ممكنة المصاحبة لها (Error)‏ والتحيز ال منتقص لمصداقية دلالاتها (Bias)‏ وامعايرة 
(Calibration)‏ في تصميم البحوث وتطبيقاتهاء وتسجيل هذه ال معلومات كبيانات وصفية. 


وبالنظر للبيانات على أنها علامة بديلة عن بعض جوانب ظاهرة ما - كالضوء Jie‏ نجما 
والخصائص الفيزيائية التي تمثل مبنى» والكلمات التي تمثل أفكار شخص - يتعلق التمثيل 
sae (Representativeness)‏ التقاط البيانات لهذه الظاهرة التي تسعى إلى تمثيلهاء dlo‏ 
أي مدى تمثل عينة البيانات التي تم إنشاؤها المجتمع الكامل للظاهرة. وفيما يتعلق 
بالسؤال السابق» فإن السؤال الرئيسي هو إلى أي مدى هكن أن نكون على ثقة من أن 
التقنيات العلمية قد التقطت بدقة الظاهرة قيد الدراسة. لقد مثل هذا التساؤل مشكلة 
خاصة في مجال العلوم الاجتماعية والإنسانية وأثبت أنه كان من الصعب حلها. فعلى 
سبيل «JULI‏ لوحظ بشكل كبير أن ما يقول الناس أنهم سيفعلون وما يفعلونه في الغالب 
ما يكون مختلفا تماما عن الواقع» وما يفعله الناس في كثير من الأحيان قد لا يقصدونه. 
ولذلك برز سؤال حول المدى الذي تمثله بيانات المقابلة الشخصية للسلوك البشريء أو 
مدى تمثيل الفكر الواعي لهم. وبالمثلء هناك مخاوف بشأن مدى التقاط وتمثيل المؤشرات 
الرئيسية للتعبير بدرجة كافية عن كيفية أداء مجال ما. على سبيل JUL‏ إلى أي مدى 
تعطي اللؤشرات المتعلقة بعدد مرات الاقتباس» ومؤشر إتش (H-index)‏ وبراءات الاختراع 
المسجلة دلالة على slof‏ عالي الجودة من قبل موظفي الجامعة (مع الاحترام لأعضاء هيئة 
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التدريس في مجال العلوم الإنسانية فإن هذه ام مؤشرات تعد سيئة للغاية)؟ ولذا كان الحل في 
محاولة تطوير تصاميم بحثية أكثر تعقيدا لمواجهة أوجه القصور في هذه الأساليب AMA‏ 
أو تجاهل أوجه القصور المتعلقة بها إلى حد كبير. 

وبالنسبة U‏ يتعلق بمدى تمثيل عينة المجتمع دراسة ماء فقد نقرر, اعتماداً على خمسين 
نجمة: إنتاج بيانات فلكية des class di ls‏ مدى طويل من أجل فهم أفضل 
لطبيعتها. ولكن إلى أي مدى يمكن أن نكون على ثقة بأن هذه الخمسين نجمة تمثل مجمل 
خصائص المليارات الأخرى من النجوم الموجودة؟ وحتى في عصر البيانات الكبيرةء التي 
تسعى إلى أن تكون شاملة وليست انتقائية في إنتاج البيانات (انظر الفصل الرابع)» فإن 
البيانات هي بطبيعتها عينة (فليس كل الناس يستخدمون وسائل التواصل الاجتماعي» أو 
يتسوقون باستخدام البطاقات الائتمانية: وبالتأكيد لا يمتلك كثير من الناس في جميع أنحاء 
العام حق الوصول إلى الهواتف وأجهزة الحاسب). وهذا يعني أن البيانات هي ممثلة 
Riga‏ من الثاني ع :لو كانت هده dius Mega]‏ عدا ubl d as‏ كاذ الحل هد 
ابتكار مجموعة من تقنيات أخذ العينات التي تسعى إلى ضمان التمثيل الدقيق في JB‏ 
مختلف الظروف (والتي تعتمد غالبا على عينة عشوائية)» واستحداث أساليب إحصائية 
تقوم بحساب مدى الثقة التي يمكننا أن نكون عليها حيال تمثيل عينة ما لمجتمع الدراسة 
.(Kitchin and Tate 1999)‏ 

وتتعلق الموثوقية بالتكرارية أو الاتساق في الحصول على النتيجة نفسها من توظيف 
آلية البحث. وقد وصف )1997 (Golledge and Stimson‏ ثلاثة أنواع من الموثوقية: 
(Y)‏ الموثوقية (quixotic reliability) à sail‏ حيث تؤدي طريقة واحدة للملاحظة 
والاستكشاف إل قياس غير متغير باستمرار. (Y)‏ اللوكوقية الزمنية المتعاقبة Diachronic)‏ 
(Reliability‏ وفيها يكون استقرار ال ملاحظات عبر الزمن. (Y)‏ الموثوقية التزامنية 
(Synchronic Reliability)‏ وفيها يكون التشابه في الملاحظات خلال الفترة الزمنية نفسها. 
وتعد الموثوقية مهمة لأنه من المسلّم به أنه كلما كان القياس أكثر اتساقاً في إنتاج البيانات, 
أمكن بشكل أكبر وصف هذه البيانات بأنها بيانات موثوقة. 
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والخطآ هو الفرق بين القيمة المقاسة والقيمة الحقيقيةء ويمكن أن يشمل الغيابات 
البيانات المفقودة. والأخطاء مثل الخطأ في الإدخال / الترميز أو الخطأ في التصنيف أو سوء 
تطبيق الأسلوب التقني» وسوء الفهم. أما التحيز فهو نوع معين من dhadi‏ حيث تنحرف 
البيانات بسبب نمط ثابت من الخطأ. وعادة ما يحدث التحيز بسبب الطريقةء أو SÖI‏ 
أو أسلوب أخذ العينات المستخدم لإنشاء البيانات والتي لها تأثير مفرط على البيانات التي 
يتم إنتاجهاء أو يمكن تقديمها بسبب موقف إيديولوجي أو تطلعات الباحث في كثير من 
الأحيان بطريقة غير متعمدة )1996 (Kitchin‏ ومن الممكن أن تتسبب آليات المعالجة 
مثل التجميع أو الإجمال في إحداث تحيز من خلال Jodi‏ من التباين في مجموعة البيانات 
مما يؤدي إلى أخطاء امغالطة المنطقية للاستدلال البيئي «Ecological Fallacy Errrors)‏ 
بمعنى أنه على افتراض تمثيل القيمة الإجمالية ممجموع الأفراد بدقة على سبيل المثال إذا 
كان لدينا شخصین وزنهما 0٠‏ كيلوجراماً وآخرين وزنهما 16١‏ كيلوجراماً فسيكون متوسط 
الوزن الإجمالي هو ٠٠١‏ كيلوجرام» ولكن لا أحد في المجموعة يزن هذا الوزن في الواقع 
.(Kitchin and Fotheringham 1997)‏ ويتعلق مفهوم عدم اليقين مدى ثقة الباحث 
بخصوص دقة البيانات وأي تحليل قائم على أساسها. أما فيما يتعلق بالبيانات الكميةء 
فيتصل بدرجة اليقين بالاختبار الإحصائي وذلك بالنظر إلى البيانات المدخلة» وعادة تحتسب 
على أساس الاحتمالات ويُعبّر عنها مستويات الثقة )2009 (Goodchild‏ أما مفهوم عدم 
اليقين بالنسبة للبيانات النوعية. فيجري في الغالب تقييمه والحكم عليه من قبل خبير بناء 
على الخبرة السابقة. 

وتتمثل دعائم معالجة هذه المخاوف بالإهان ob‏ مثل هذه القضايا Liss‏ بسبب الضعف 
البشري في تصميم البحث أو أوجه القصور وعدم كفاءة الأدوات والمعدات أو الطرق 
المستخدمة والتي من الممكن التغلب عليها من خلال الحلول التقنية. وهذا يعني أنه من 
الممكن معالجتها عن طريق تحسين نوعية الإجراءات والمعدات المستخدمة» وتطبيق أنظمة 
التوحيد القياسي (التقييس- (Standardization‏ والتي توفر معاي 
مثل تلك التي أقرتها المنظمة الدولية للمعايير آيزو (ISO)‏ والتي تعمل على إيجاد سبل 
للتعويض عن عدم اليقين والخطأ والتحيز في وسائل التحليل ا مستخدمة. 
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المنظور الأخلاقي :(Ethically)‏ 

الأخلاق d ss‏ بالفكر والممارسة المتعلقة بمفاهيم القيم مثل العدالة: والممساواة, 
والنزاهة» والصدق» والاحترام» والحقوقء والواجبات» والرعاية. ويعمل كل مجتمع وفق 
مزيج من القيم الأخلاقية الفطرية البديهية والعامية غير الرسميةء المسلم بهاء والمواقف 
الأخلاقية المقنثة جيداً والمنصوص عليها في قواعد. ومبادئء وسياساتء وتراخيصء وقوانين 
تخضع للإنفاذ من قبل أجهزة الدولة والوكالات الأخرى. وكثيراً ما تكون هذه المواقف 
الأخلاقية محل نزاع بين مجموعات مختلفة تأخذ وجهات نظر متناقضة عن القيم نفسها 
وإلى أي مدى ينبغي إخضاع ال مواقف الأخلاقية للتشريع القانوني» ومناقشتها كممارسة في 
الفلسفة الأخلاقية. كما يوجد مثل هذا الطعن فيما يتعلق بالبيانات» وخاصة ما يتعلق Le‏ 
يتم إنشاؤه من بيانات ووسائل الإنتاج لهاء وكيفية مشاركة البيانات وتقاسمهاء وتداولهاء 
وحمايتهاء وإلى الحدود التي ينتهي عندها العمل بها. 

E‏ تقد بعضن البيانات معتدلة ee ad‏ غلى سبيل UU‏ القيانيات المتعلقة 
بالطقسء فإن بعض البيانات الأخرى تعد حساسة للغاية» كالبيانات المتعلقة بالأفراد والتي 
يمكن استخدامها لإنتاج صورة مفصّلة عن الحياة المعيشية لهم» وضبط وتنظيم تلك الحياة 
على إيقاع معين. وقد يلحق إنتاج البيانات ضرراً في بعض الحالات: على سبيل امال 
الأضرار التي قد تنتج عن إجراء مقابلات مع ناجين من جرائم الحرب وما قد تتسبب 
فيه تلك المقابلات من ضغوطات نفسية وضيق. وف هذا المقام. هناك تساؤلات حول 
المدى الذي من الممكن أن يشكل فيه إنتاج البيانات. ومختلف أشكال اراقبة والترصد 
للبيانات (Dataveillance)‏ أي المراقبة والرصد من خلال معالجة وتحليل سجلات البيانات» 
وتحليل البيانات Dass‏ على الخصوصية وحقوق الإنسان الأخرى. وتساؤلات أيضاً حول 
المدى الذي هكن أن تستخدم فيه هذه البيانات بفعالية لفرز الأفراد اجتماعياً معنى تقديم 
خدمات تفضيلية على أساس خصائص الأفراد ا مميزة لهم )2005 (Graham‏ وتتعاظم 
هذه ال مخاوف بالنظر إلى سهولة جمع ومشاركة وتداول البيانات الرقمية. ونحن نعيش في 
pas‏ توليد البيانات ومراقبتها بصورة طاغية وعلى نطاق واسع. ولعله ليس من ال مستغرب 
بعد ذلك أن وكالات تمويل البحث العلمي ومؤسسات التعليم العالي الآن تقيّم بشكل دوري 
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الأبعاد الأخلاقية للمشاريع البحثية نظراً لآثارها ا محتملة على نطاق rusi‏ وإضافة لذلك 
فقد سنت الدول تشريعات» مثل قوانين حماية البيانات وقوانين الخصوصية. في محاولة gil‏ 
سوء الاستخدام والتجاوزات المسيئة للبيانات» ولقد تم مناقشة هذه ال مسائل وما يتصل بها 
بشكل مفصل في الفصل العاشر. 


المنظور السياسي والاقتصادي :(Politically and Economically)‏ 
مثل الاهتمام بال منظور الأخلاقي للبيانات البداية للكشف عن الطرق التي تعمل على 
تأطير البيانات من خلال الاهتمامات السياسية والاقتصادية على نطاق أوسع. وتتعلق 
هذه الاهتمامات هاهية البيانات التي يتم إنشاؤهاء وكيفية معالجتهاء وتحليلهاء وتوظيفها 
as‏ ال كبقية bd‏ البانات: وكوصيقها معاررا ضمق aie bete cadi‏ وتوظيقيا 
من قبل الدول» ومفاهيم الكيفية التي ينبغي بها تنظيم البيانات وتقنينها؛ والمناقشات التي 
تطرح ضمن مجموعات الاختصاص التي تؤيد أو تعارض إنتاج البيانات وتطبيقاتها؛ واتخاذ 
القرار حول التمويل والاستثمار في البيانات؛ وانتشار الرأسمالية والطرق التي تستخدم 
البيانات لإدارة المساعي وزيادة القيمة والأرباح؛ والتداول للبيانات كسلعة مع ظهور سوق 
للبيانات تقدر قيمته بمليارات الدولارات والتي يشارك فيها مجموعة متنوعة من اللاعبين 
كالمنتجينء ا مجمُعين» البائعين» ا محللين» والمستهلكين» انظر الفصل الثاني. فمنتجو البيانات 
ينبغي عليهم الأخذ بعين الاعتبار الرأي العام «sal als‏ والاعتبارات الأخلاقية والبيئة 
التنظيمية والتمويل المتاح وسلامة استثماراتهم إزاء ا موارد. كما ينبغي على أولئك القائمين 

على الساحتين التشريعية والتمويل المالي أن يكون لديهم سعة الأفق واتخاذ القرارات حول 
كيفية تشكيل المشهد الذي يعمل به منتجو ومستخدمو البيانات» وكذلك النظر في أنظمة 
العمل المتعلقة بالبيانات الخاصة بهم وما يكشفونه عن جداول أعمالهم وأولوياتهم 

وأساليب الإدارة والحوكمة الخاصة بهم )2012 (Lauriault‏ 

وف كلتا الحالتين» هناك مجموعة متنوعة من العلاقات السياسية والاقتصادية العقلانية 
في المشهد. مع أصوات متنافسة تسعى للتأثير على الرأي ومشهد البيانات على النطاق 
الأوسع. فعلى سبيل المثالء فإن حركة البيانات المفتوحة تمثل البيانات كسلعة عامة تتشكل 
من العموم وتكون في متناول الجميع s o‏ مطلقة بام نام dal Lu uri‏ 
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والشخصية الخاصة أو يمكن الوصول إليها من خلال اتفاقيات الاستخدام العادل. وفي 
المقابلء يعرض قطاع الأعمال البيانات كسلعة تجارية قيّمة تحتاج من جهة إلى الحماية 
من خلال أنظمة الملكية الفكرية (حقوق الطبع والنشرء براءات الاختراع» وحقوق الملكية) 
ولكنء من جهة أخرى لا ينبغي ربطها بشدة بالمحاذير الأخلاقية التي تمنع من استغلالها 
لتحقيق المكاسب المالية. أما بالنسبة للمجتمعات والدولء فالبيانات هي الوسائل التي 
يمكن من خلالها تقنين» وممارسة» ومنازعة الأجندات السياسية والأعمال عبر تمكين بناء 
الإثباتات - أي الروايات المسندة والدعوات المضادة التي لها قيمة بلاغية أكبر من مجرد 
التندر أو دغدغة المشاعر )2013 (Wilson 2011; Garvey‏ وبعبارة أخرىء تعد البيانات 
بالنسبة لعام الفلسفة الفرنسي 1981( (Foucault's‏ شكلاً من أشكال السلطة / ال معرفة؛ أي 
وسيلة يمكن من خلالها ضبط وتنظيم الشعوب» والظواهرء والأقاليم )2012 .(Lauriault‏ 
وتتقاطع هذه الاهتمامات والمصالح البديلة في كثير من الأحيان بطرق متناقضة» من حيث 
أنه قد يكون لها أجندات مختلفة تماماء على سبيل JULI‏ دعم الأعمال التجارية الكبيرة 
لحركة البيانات المفتوحة فيما يتعلق بالبيانات العامة (انظر الفصل الثالث). وبعبارة 
غرف تظير المانات جلا وكتموضع ضمن الاقتصاوات الساسة bas]‏ وق القت 
نفسه فهي تستخدم لتشكيل Jio‏ هذه القضايا والنظم وا لمجموعات. 


وعلاوة Js i43 «elis ue‏ البيانات موردا datadi‏ وهي عنصر أساسي في المرحلة المقبلة 
من الاقتصاد القائم على ال معرفة. وتعمل على إعادة تشكيل نمط الإنتاج القائم على البيانات 
(انظر الفصل السابع). ومنذ أواخر الثمانينيات (1905). يرى بعض العلماء مثل Castells‏ 
)1996 ,1988( أن آخر دورة للرأسمالية يدعمها إنتاج المعرفة التي تنشئ منتجات وأشكال 
عمالة جديدةء وتسهّل إعادة الهيكلة الاقتصاديةء وتعزز الإنتاجية والقدرة التنافسيةء والكفاءة 
والاستدامةء وتراكم رأس المال. وتعد البيانات الكبيرةء على وجه الخصوصء هي أحدث 
التطورات المتعلقة بتعميق وتعزيز هذه الدورةء وتوفير ثورة من الأدلة التي يتم استخدامها 
من قبل الشركات من dd ge‏ لرصد وتقييم أداء الشركة اللحظيء والحدٌ من الهدر والاحتيالء 
وتحسين إستراتيجية الشركات» والتخطيط وصنع القرارء ومن جهة أخرىء لتصميم glo‏ جديدة 
وتحديد واستهداف أسواق جديدة. وتطبيق التسعير المتغيرء وإدراك الإمكانات غير ال مستغلة, 
واكتساب ميزة تنافسية )2012 às .(Manyika et al. 2011: Zikopoulos et al.‏ سبيل 
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القيام Ui‏ يمكن إنتاج وتحليل البيانات من تشغيل الشركات بشكل أكثر ذكاء فيما يتعلق 
بكيفية تنظيمها وتشغيلهاء وتعزيز المرونة والابتكارء والحد من المخاطر والتكاليف والخسائر 
التشغيليةء وتحسين تجربة العملاءء وتعظيم العائد من الاستثمار والأرباح. وكقائد لعملية 
تراكم رأس «JUI‏ ستسهم البيانات الكبيرة في إيجاد أعمال (وظائف) جديدة وفي الجولة المقبلة 
من التنمية غير ا متوازنةء ومن هذا المنظور يمكن فهم البيانات على أنها وكيل ممصالح رأس امال 
واهتماماته. 


المنظور الزماني والمكاني :(Temporally and Spatially)‏ 
تمتلك البيانات أبعاداً زمانية ومكانية على Xo‏ سواء. حيث تختلف ماهية البيانات التي 
يتم إنتاجها والطرق التي يتم بها معالجتهاء وتحليلهاء وتخزينهاء أو التخلص منها باختلاف 
الزمان والممكان؛ أي أن للبيانات ومجاميعها المحيطة بها دلالات تاريخية وجغرافية. كما 
تتغير كيفية معالجة البيانات وتحليلها مع مرور الوقتء متأثرة بالتغيرات والتحسينات 
التنظيمية ف التعداد والإدارةء والقوانين الجديدة المتعلقة بتداول البيانات وحمايتهاء 
والتقنيات الجديدة. والطرق الجديدة في فرز البيانات وتحليلهاء والاختلافات الإحصائية 
الجغرافية مثل حدود المقاطعة المحلية أو الوطنية الجديدة: والأساليب الإحصائية الجديدة. 
وعلاوة على ذلكء يمكن لمجاميع البيانات التي تستخدم في ولاية معينة أن تكون مختلفة 
تماما عن تلك التي تستخدم في 5,21« وحتى داخل حدود الولاية الواحدةء فقد تختلف 
الطريقة التي يقوم فيها كيان ما بإنتاج البيانات وإدارتها بسبب التقلبات المؤسسية أو 


وبالنظر في التعدادات السكانية» يتكون التعداد من مسح شامل لنطقة وساكنيهاء 
ويتم إجراء المسح في العادة كل عشر سنوات» والهدف من ذلك هو gaz‏ معلومات 
أساسية حول المقيمين في منطقة ما وخصائصهم على سبيل المثال» العمرء الجنس» الحالة 
الاجتماعية: التركيبة الأسريةء الدينء العرقء الطبقة الاجتماعية. وما إلى ذلك وجوانب 
عيشهم فيها (عملهم» ومكان الإقامة» وما إلى ذلك). ويتطلب تمكين قياس التغيير في 
التعدادات السكانية الاستمرارية فيما يتعلق بالأسئلة المطروحة فيها والكيفية التي تدار 
بها هذه التعدادات. وف ذات الوقت» يتطلب التقاط البيانات الجديدة موضع الاهتمام 
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والتي تعكس تغيرات أوسع في ال مجتمع» إجراء تغييرات على آلية هذه التعدادات» مثل 
إضافة أسئلة جديدة أو التعديل على الأسئلة الأساسية (انظر الشكل :V-Y‏ ولاحظ كيف أنه 
حتى عندما تم الحفاظ على الأسئلة عبر التعدادات السكانية المتعاقبة: فإن كيفية صياغتها 
كانت غالبا ما تكون مختلفة تماما في كل مرة). وعلاوة على ذلك» فإن الكيفية التي 
يدار بها التعداد السكاني كانت تتشكل في التعدادات المتعاقبة من قبل قوى مؤسسية. 
وسياسية» واقتصادية. وتطورات تقنية جديدة : انظر 1991( (Linehan‏ للتعرف على 
تاريخ التعداد السكاني الايرلندي من (Lauriault (20125 ء۱4٩١ - YAYY‏ لتحليل التعداد 
الكندي من .Y- VY - ۱۸۷١‏ علاوة على «US‏ يتعرض التعداد للطعن والتفاوض حيث 
تتنافس مصالح خاصة «eua‏ أو تغييرء أو إزالة الأمئلة منها. وفي بعض الحالات» يمكن أن 
تكون التغييرات ا مطلوبة جذرية بشكل متطرفء مثل القرار الأطاني بوقف إجراء التعداد 
السكاني في الثمانينات (انظر 2011 (Hannah‏ ونتيجة لذلك» يرزح التعداد الوطني دائماً 
تحت وطأة التوتر الناتج عن الاستمرارية والتغييرء ومع ذلك يتطور مع مرور الوقت وفي 
مناطق جغرافية مختلفة. وحتى «oM‏ ومع ذلك فقد كان هناك عدد قليل من مجاميع 
البيانات المميزة Alder 2002; Desrosiéres 1988; Hannah 2011;) TR ER:‏ 
(Hewitt 2010; Lauriault 2012; Poovey 1998; Porter 1995‏ 


ثورة البيانات البيانات الكبيرة» والبيانات ärgh‏ والبنى التحتية للبيانات» والنتائج المترتبة عنها ev‏ 


شكل )5-7( 


$e) سم > > سر ماس وعد‎ s 


المنطقة 


فترة البطالة للعام السابق 
الوضع الحالي 


آنواع المدارس 
الإقامة في الخارج 


المؤهلات العلمية آو التكنولوجية 


الإقامة المعتادة الآن 
الإقامة المعتادة قبل عام واحد 


أعضاء الأسرة الفانبين 
وسانل التنقل للعمل آو المدرسةء الخ 


حالات الوفاة في الأسرة منذ آخر تعداد 


مستوى الأمية (معرفة القراءة والكتابة) 


الإقامة في العام الماضي 


الاسم الأول وآسم العائلة 
عنوان مكان العمل» المدرسة» الخ 


سعة النماذج/ أعداد الأشخاص 
مجال العمل (صاحب عمل آم موظف) 
المسافة إلى العمل» المدرسةء الخ 


الأبناء من آخر زوجة على قيد الحياة 
سن التوقف عنده عن الدراسة النظامية 


الفصل الأول 


X» X Qo: 9 6 9o ao ao ao a ao ao do do do do ds do dodo dod dod dod d d ong‏ يخ سخ يخ > سر يخ يخ اح 


BOXOXOX X مز م‎ xXx o-xo0zc 
BOoxXxoxoxumoxoxoxoxo-xoc 
X ox ox > عد »ع‎ xXx << عد‎ 0c 
Xx x«xx005 حا يا‎ 
سخ مح مح‎ XXX xo 
CRR EDE a 5 
2 اجو جز »> عو يو‎ 2 5 
ا يا يخ ص يح سر يا م‎ s 
2 اط يطح تتم يار يح يخ‎ i l 


II‏ يخا سخ إن سخ سح مع 


ال مصدر : منقول بتصرف عن 1991 .Linehan‏ 
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المنظور الفلسفي :(Philosophically)‏ 

بالنسبة للبعضء تعد البيانات على ا مستوى الوجودي (Ontological level)‏ حميدة 
(غير خطرة). فالبيانات هي مجرد بيانات» وعناصر أساسية يتم استخراجها من العام 
بطرق محايدة وموضوعية تخضع لقيود تقنية. فهي "لا تمتلك أي معان ضمنية كامنة 
فيهاء ولا تقدّم بالضرورة أي تفسيرات أو «bl‏ ولا تحمل خصائص دلالية قد تكشف عن 
أهميتها وصلاتها " )2010 (Pérez- Montoro and Díaz Nafría‏ فهي تخمينية قابلة 
للتحليل. ومن هذا ال منظورء فإن جهاز الاستشعار (sensor)‏ على سبيل JELI‏ ليس لديه أي 
سياسة أو جدول أعمال. فهو ببساطة يقيس الضوء أو الحرارة أو الرطوبة ...الخ - حيث 
يقوم بإنتاج القراءات التي تعكس حقيقة الواقع عن العام المحيط ما مم يشوبه خلل فني. 
وبعبارة أخرىء تنتج أجهزة الاستشعار نظرة موضوعية واقعية عن العام وتكشف عن 
الأشياء كما هي في الواقع» حيث إن قياس واقعية الشيء هو مستقل عن عملية القياس له 
.(Desrosières 1998)‏ أما في إطار عمليات القياس التي يلعب فيها العنصر البشري دوراً 
مركزياً - في التجارب المخبرية» أو إجراء مسح ميداني أو مقابلة شخصية - فإن عمليات 
القياس تطبّق شكلاً من أشكال الموضوعية ا ميكانيكية التي تلتزم بقواعد محدذّة وطرق 
منهجية دقيقة لإنتاج Dllo‏ منفصلة» غير متصلة» ونزيهة على نحو شفافء وخالية من 
تحيز الباحث وهواه وتفضيلاته» ومن ثم فهي مستقلة عن العادات» والتقاليدء والثقافة, 
والمعرفة. والسياق )1995 (Porter‏ وعلى هذا النحوء فإن العلم عند ممارسته بشكل 
صحيح لا ينبغي أن يتلبس بأي دوافع سياسية أو أجندات خفية بحيث يمكن بعد ذلك 
أن تؤخذ البيانات على ظاهرها وعلاتها. وف الواقع. تقترح المصطلحات المستخدمة عادة 
لتفصيل كيفية التعامل مع البيانات عمليات تقنية حميدة مثل: «الجمع» «الإدخال» 
«ez jl»‏ «التخزين»». «المعالجة»». و«التنقيب» )2013 .(Gitelman and Jackson‏ ولذا 
فإن استخدامات البيانات هي التي تخضع للإملاءات السياسية. وبعبارة أخرىء إن الناس 
هم من يفسدون البيانات ويعملون على تجييرها مصالحهم الخاصة» وليس للعلم بحذ 


ذاته. 
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وبالنسبة لآخرينء فإن هذا الرأي لا يمكن تبريره والدفاع «xe‏ إذ تتحدّد طبيعة البيانات 
بفعالية من خلال الكيفية التي يمكننا بها تصور البيانات» وقياسهاء والتعامل معها. فبالنسبة 
لهم» البيانات م تكن موجودة قبل إنتاجها؛ إلا أنها لا تنشأ من العدم. exis.‏ إنتاج البيانات 
من خلال القياس. والتجريد والاقتباس. وتعميم التقنيات التي تم وضعها ضمن تصور 
لتنفيذ مهمة ما Jas‏ في الأشكال وامقاييس التي تتفق مع ال معايير التي اخترعها الناس 
على سبيل JUL‏ النظام المتري. فالبيانات هي وحدات معرفية. جعلت على نموذج تمثيلي 
لتمكين وإتاحة العمل ال معرفيء وقياس وتسجيل البيانات عن نفس الظاهرة من خلال 
العديد من الطرق والأساليب» التي edi‏ كل منها مجموعة مختلفة من البيانات التي يمكن 
تحليلها وتفسيرها باستخدام وسائل مختلفة )1998 تإع8007). فالكيفيات التي يتم إنشاء 
البيانات بها لا هكن حصرها نظراً لتعدد التصاميم والنقاشات والتعديلات التي تطرأ على 
البروتوكولات» والعمليات التنظيميةء ومعايير القياس» والفئات» والمعايير الخاصة بالبيانات 
في ظل الفوضي المصاحبة لعملية توليد هذه البيانات وإنتاجها. فلو أخذنا حالة قياس 
التعداد السكاني لبلد ما: فإن هنالك العديد من القرارات التي يجب أن تتخذ مثل تلك التي 
تحدد من يضاف للتعداد ومن يستثنى منه على سبيل JELI‏ أن يشمل الزوارء والأجانب 
المقيمين بصورة مشروعة أو غير مشروعة» وأولئك الذين يتجنبون المشاركة عن عمد أو Y‏ 
وما إلى ذلك وأين يجب أن يتم تعدادهم على سبيل JLA‏ تعدادهم تبعا لإقامتهم ليلة 
إجراء التعداد أو مكان إقامتهم الدائمة في العادة؛ فجميع أنواع القواعد والإجراءات يتم 
وضعها قبل التعداد» ومع ذلك يظل هناك أمور لم يتخذ قرارات بخصوصها واختلاف عبر 
العدّادين في طريقة التطبيق )1995 (Porter‏ 

ونتيجة لذلك» فإن الكيفية المتبعة لتعريف البيانات وتحديدها وجودياً ليست عملية 
فنية محايدةء ولكن معايرة سياسية وأخلاقية يجري التنازع عليهاء ولها نتائج قابلة 
للتحليلء والتفسيرء والعمل في وقت لاحق )1999 .(Bowker and Star‏ ومع ذلك 
ممرة أخرىء تعمل تبويبات البيانات على استبعاد التباينات والتقلبات وتحديد ما يتاح 
ويحجب داخل مجموعة البيانات» وعلى الرغم من EUS‏ تكون هذه العملية من التقارب 
والاستقرار معرضة على الدوام للممانعة والرفض وإعادة الصياغة بسبب تعدد الجهات 
الفاعلة» والموضوعات والعمليات موضع ال مناقشة olg‏ والتناقض الحاصل في البيانات 
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والذي Y‏ هكن تطبيقه بسهولة وما يتناسب مع نظام ما )1999 (Bowker and Star‏ 
وعلاوة على ذلك» فإنه بمجرد إنتاج البيانات يكون من الممكن فرزء وتقسيم» وتكعيب 
هذه البيانات بطرق متعددة في عدد من الفئات. وبعبارة «sS‏ فإن البيانات ليست 
مستقلة عن نظام الفكر والأدوات التي تدعم إنتاحها )1999 (Bowker and Star‏ فهذه 
النظم الفكرية مُطعّمة بافتراضات فلس فية ومعتقدات تمارس بشكل مختلف. فالواقع, 
وكما لاحظ )38 :2007( Borgman‏ أنه في الوقت الذي يسعى فيه العلم إلى تصوير نفسه 
بالعامية والعموم» تبدو ممارسات العلوم محلية ومتباينة على نطاق واسع. ومن ثم OB‏ 
البيانات لا تمثل ببساطة واقع وحقيقة العالم؛ فالبيانات هي وحدات بنيوية حول العام 
.(Desrosiéres 1998; Poovey 1998)‏ من هذ المنظور «يتم إنتاج المعرفة العلمية - 
Ya‏ من 8slp‏ اكتشافها» ')4 :2013 .(Gitelman and Jackson‏ كما à‏ التالي: 
إذا كان إنتاج البيانات عن طريق أداة مثل شبكة استشعارء فإن تفسير 

هذه البيانات يتطلب فهم الأداة - على سبيل المثالء ما الذي تستكشفه أجهزة 

الاستشعار؟ وتحت أي ظروف؟ وكم عدد تكرار مرات الملاحظة؟ ومع أي نوع 

من المعايرة؟ )183 :2007 .(Borgman‏ 


ومع ذلك نجد أن العلم يحاول في كثير من الأحيان جعل البيانات حرة ومستقلة 
عن مثل هذا الفهم السياقي» وتنظيم ومشاركة البيانات من خلال قواعد البيانات التي 
يجري التحسين فيها والتخفيف من čio‏ الفوضى عند إنشائها وحماية المستخدمين من 
معرفة كيفية إنتاج البيانات وتنظيمها )2013 .(Gitelman and Jackson‏ ولذلك› o‏ 
Ribes and Jackson (2013: 165)‏ أن الاستخدامات العلمية للبيانات والقائمة على أنها 
محايدة وموضوعية هي مجرد تخيلات لا حقيقة لها؛ أنها «تفترض وتصور العام sli‏ على 
البيانات المتداولة دون النظر إلى مصدرهاء وحالتهاء وجوهرهاء وتاريخهاء ومن ثم تبرز 
هذه البيانات على uil‏ حرة للتنقل عبر bll‏ كعملة غير متمايزة وعاطية». في المقابلء 
هما يؤكدان أن «البيانات هي أكثر ارتباطا من ذلك». 

ونتيجة UU‏ فالبيانات غير مسبقة التحليل. وليست polis‏ موضوعية مستقلة. كما 
بينها )2 :2013( Gitelman and Jackson‏ متبعين à‏ ذلك بوكر )2005( Bowker‏ عندما 
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ذكروا ol‏ "البيانات الخام هي مصطلح متناقض؛ «فالبيانات هي على الدوام "مطهوة' 

سلفاء bg‏ تكن Log‏ "خاما" أبدا. فهناك حاجة لتصوّر البيانات كما هي على الحقيقة في 
الوجود والعمل موجب ذلك" )3 :2013 .(Gitelman and Jackson‏ فالبيانات - على 
d‏ سواء - هي اجتماعية من باب أنها تقع ضمن السياقء ومادية من باب أن لديها 
شکلا (كأرقام ثنائية» أو رموزء أو أعداد... وما إلى ذلك)» ويجري تخزينها على الورق» 
والأشرطة الممغنطة. والأقراص الصلبةء وما إلى ذلك Wilson 2011; Gitelman and)‏ 
(Jackson 2013‏ كلا ا منظورين يعمل على تشكيل القواعد التأسيسية للبيانات» فعلى 
سبيل «JULI‏ تعتمد البيانات الكبيرة على النقاشات الأخلاقية, والاقتصاديةء والسياسية في 
المجالات المختلفة التي تدعم البدء في اعتمادها وتنفيذها (انظر الفصل (gll‏ وتعتمد 
على قواعد البيانات» والحواسيب» والخوادم» وشبكات الاتصال التي تمكن بدورها عمليات 
إنتاج البيانات» ومعالجتهاء ومشاركتهاء وتحليلهاء تخزينها (انظر الفصل الخامس). deis‏ 
هذه aL ua JeSL gll‏ الناناك (lis)‏ وسو #وضعيا أو تسمانهاء أوحذفياء أو (ISO‏ 
من خلال تلف الوحدة التخزينية el SU‏ الثنائية - بت (أي تعطل وسائط التخزين نتيجة 
تحلل الأشرطة الممغنطة أو تضرر الأقراص الصلبة) )2013 (Boellstorff‏ وفي الواقع م 
تكن البيانات قط مطهوّة فقط ولكنها أيضاً منفتحة لتقبّل أساليب «غير مخطط dal‏ وغير 
متوقعة» وعرضية» و«متحولة بأشكال شبة إنسانية معقدة, وطرق زمانية ناشئة لا تتبع 
على الدوام وصفة dolus‏ محددة .(Boellstorff 2013) diua‏ 


ونظراً للطبيعة الاجتماعية والمادية للبيانات» فإننا ننشط في Bale]‏ صياغة وتشكيل 
«عوالمنا المادية» والتقنية» والجغرافية» والتنظيمية. والاجتماعية إلى نوع من البيئات 
التي يمكن للبيانات أن تزدهر فيها... والوصول إلى العلاقة التكافلية مع البيانات» 
(Ribes and Jackson 2013: 152)‏ ومن ثم» وبينما JAS‏ إلى البيانات بوصفها uà‏ 
موجوداً - شيئاً حول الواقع )2013 Shah‏ التأكيد الأصلي). فإن الفهم الأكثر إنتاجية 
للبيانات هو اعتبارها أحد مكونات الواقع وأحد مُنتجي الواقع في ذات الوقت. إن 
البيانات ليست محض فكرة تمثيلية مجردةء بل هي تأسيسية: وإنتاجهاء وتحليلهاء 
وتفسيرها له نتائج وعواقب تتبعها. وكما بين )2 :2013( :Gitelman and Jackson‏ 
«إذا كانت البيانات تخضع UJ‏ بطريقة أو بأخرى» فإننا نحن أيضاً نخضع للبيانات». 
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حيث يتم م التقاط البيانات من «esI‏ ولكن في المقابل تعمل في العام. إن البيانات م 
تكن dass‏ ولا مكن أن ÙS‏ حميدة )2013 (Shah‏ بدلا من ذلك. من الضروري 
فهم «البيانات على أنها مؤطرة متأثرة Un ss‏ ومؤطرة مؤثرة على غيرها» Gitelman)‏ 
.(and Jackson 2013: 5‏ وبعبارة أخرىء. هناك حاجة إلى ما هو أكثر من مجرد 
الاعتراف العام من قطاعي العلوم والأعمال لأهمية التصوّر المفاهيمي للبيانات. 


التفكير النقدي حول قواعد البيانات والبنى التحتية للبيانات: 

$ العادةء يتم تجميع البيانات في مجاميع (Datasets)‏ في محاولة لفهم البيانات, والتي 
غالباً ما يتم تنظيمها وتخزينها في قواعد بيانات (وهي وسيلة لتنظيم وتخزين البيانات 
التي هكن الاستعلام عنها بطرق متعددة) وبنى تحتية للبيانات مثل نظم المحفوظات 
الأرشيفية (Archives)‏ وحاويات البيانات (Repositories)‏ (انظر الفصول الثاني والثالث 
والخامس). وكما كان الحال مع التصور المفاهيمي للبيانات بشكل «ele‏ فمن المهم كذلك 
التفكير بشكل نقدي حول طبيعة قواعد البيانات والبنى التحتية للبيانات» وإنتاجها من 
a dul‏ الاجتماعية p eel ds nd Tice) c‏ العقلانية d‏ 


إلى حد y‏ فيما يتعلق بالبيانات SII‏ والبيانات me‏ والبيانات الصغيرة موش عة 
مع التركيز حتى الآن عليه ليكون ذا طبيعة تقنية وآلية بشكل أكبر. 

وتمتدٌ الفرضية المطروحة التي تم“ تبنيها وتطويرها في جميع أنحاء هذا الكتاب من الحجة 
dull‏ في القتسم الأخيرء وهي الافتراض بأن قواعد البيانات والبنى التحتية للبيانات ليست 
ببساطة Sylo‏ أو وسائل تقنية لتجميع وتبادل البيانات؛ وليست بالتأكيد منتجات لتخزين 
البيانات الملتقطة عن العام ولكنها حزم من العمليات الطارئة والمترابطة التي تقوم بتأدية 
الأعمال في العام )2011 (Star and Ruhleder 1996; Kitchin and Dodge‏ إنها أنظمة 
اجتماعية تقنية معقدة كامنة كجزء لا يتجزأ ضمن المشهد المؤسساق الأكبر من الباحثين» 
وا مؤسسات» والشركات» التي تشكل أدوات أساسية في إنتاج المعرفة والحكم ورأس JUI‏ 


us‏ تصميم وبناء قواعد البيانات على تقبّل أنواع معينة من البيانات وتمكين أنواع 
معينة من التحليلء ولذا فهنالك آثار عميقة مترتبة على الكيفية التي يتم بها هيكلتها على 
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الاستفسارات والتحليلات الممكن أداؤها؛ كما أن شروط صياغتها من شأنها أن تحدد العمل 
الذي هكن القيام به عليها ومن خلالها (2012 .(Ruppert‏ فعلى سبیل «JUL‏ يختلف 
تخزين البيانات في قواعد البيانات اختلافاً تاما عن الشكل السردي من حيث ما تم تخزينهء 
وكيف يتم تخزينه» وكيف من الممكن استدعاؤها وإعادة استخدامها )2005 (Bowker‏ 
وينتج عن قواعد البيانات إهمال وتجاهل لبعض البيانات» إضافة إلى الثغرات الكامنة في 
البيانات» وذلك كلما تم الكشف عن علاقات بين البيانات وتوفير الإجابة عن بعض الأسئلة 
التي يتعين الإجابة عنها؛ فهي تقيّد وتتيح من خلال وجودها (الأنطولوجيا)» qais‏ العديد من 
العلاقات في ذات الوقت الذي يتم فيه إخفاء علاقات أخرى )2013 (Ruppert 2012; Vis‏ 
واستناداً إلى Derrida‏ فقد جادل )12 :2005( Bowker‏ بأن قواعد البيانات وا محفوظات 
الأرشيفية هي المتحكم (155176ا(): فهي "تقول UJ‏ ما نستطيع وما لا نستطيع أن نقوله" من 
خلال تحديد ما يمكن تذكره وما يجري تجاهله ونسيانه. فهذا التذكر والتناسي يتم تحديده 
في الأصل من خلال أنظمة وممارسات مبنية على قوانين سياسية وفلسفية. 

ومن هنا فإن التبويبات داخل قواعد البيانات غير ثابتة وغير طبيعية» ولكن يتم إنشاؤها 
من قبل جهات فاعلة ذات أهداف محددة تعمل ضمن مجتمعات ال ممارسة. أساليب 
الحوكمة. والقيود التقنية الفنية. ومن ثم» فإن قواعد البيانات هي تعابير عن السلطة / 
المعرفة وهي تقوم بإقرار تشريعها وإعادة إنتاج هذه العلاقات )2012 (Ruppert‏ على 
سبيل JELI‏ تحديد معدل التأمين لشخص ما أو ما إذا كان بإمكانه السفر بين البلدان. 
وعلاوة على «US‏ فإن قواعد البيانات هي كيانات ديناميكية متغيرة تقوم بإجراء «عملية 
مستمرة من التمييز والتفريق» )129 :2012 (Ruppert‏ من خلال التفاعل مع مجاميعها 
المرتبطة بها (المنشئونء االمستخدمون. البرمجيات, الأجهزة. الشبكات» وما إلى ذلك). 

وف الوقت نفسه» عملت قواعد البيانات على فصل عملية تحليل البيانات عن البيانات 
نفسها من خلال تمكين إجراء استعلامات وحسابات معقدة دون الحاجة إلى إجراء هذه 
التحليلات التي تتطلب الاطلاع والعمل مع البيانات نفسها أو حتى فهم الكيفية التي 
تم من خلالها تجميع البيانات وتنظيمها )2013 .(Gitelman and Jackson‏ وقد تم 
تعزيز هذا الفصل من خلال آليات مثل التوحيد العياري (Standardization)‏ للصيخ 
والبيانات الوصفية والتعامل مع البيانات دون النظر إلى السياق الواردة فيه وبعيدا عن 
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التأثير السياسي )2011 .(Wilson‏ والأهم من ذلكء فإن هذا الفصل والتحرير للبيانات 
قد مكن السلطة / المعرفة المتعلقة بقواعد البيانات من الانتقال والانتشار وليتم توظيفها 
من قبل الآخرين بعيداً عن الأعمال الداخلية المعقدة فيها وتاريخها وسياسة الإنتاج لها 
(بالطريقة نفسها التي يستفيد فيها السائق من السيارة من دون معرفته كيفية صنع US‏ 
أنظمتها المعقدة أو ماذا تعمل أو كيفية تفاعلها لتشكيل تجربة القيادة). ومن ثم يمكن 
للباحثين الاستفادة من قواعد البيانات الحكومية مثل التعداد السكاني أو المسح التجاري أو 
المؤشرات الاقتصادية دون معرفة الدوافع السياسية لم وكيف تم بناء قواعد البيانات» أو 
الجوانب الفنية لإنتاجهاء أو وجود الألفة الشخصية مع الظواهر الملتقطة. على سبيل «JULI‏ 
استخدام الوزارة الإيرلندية للبيئة لقواعد بيانات عقارية غير مكتملة في آيرلندا في مرحلة 
ما بعد الانهيار الاقتصادي 2008 (متوفرة على الرابط: 


(http://www.housing.ie/OurServices/Unfinished-Housing-Developments.aspx 


حيث كان للمرء أن يجري البحثء والتصور, والاستخلاص للنتائج حول العقارات في 
إيرلندا دون أي معرفة مسبقة عن تاريخ وسياسات المسح, وكيف EI‏ القيام «d‏ ودون زيارة 
أي من تلك العقارات (انظر .(Kitchin et al., 20128, b‏ فمثل هذا التحرير والفصل مكن 
من العمل مع قواعد البيانات على أنها غير متغيرة ومستقرة وقابلة للتحول والنقل عبر 
المكان والزمان )1989 (Latour‏ 

وتستضيف البنى التحتية للبيانات قواعد البيانات وتصل بينها لتشكل بنية تقنية 
اجتماعية أكثر تعقيداً. وكما هو الحال مع قواعد OLLI‏ لا يوجد شيء كامن أو مُعطى 
حول كيفية تكوين هذه الهياكل الأرشيفية والتشاركية. وف الواقع» وكما نوقش في جميع 
أنحاء الكتاب» تعرّض تصميم وإدارة البنى التحتية للبيانات إلى تحديات تقنية وسياسية تم 
التصدي لها من خلال نقاشات فوضوية ومفاوضات عبثية تمت في سياق أتصف بالعديد 
من الأجندات (جداول الأعمال) والقولبة الحكومية» فالحلول التي 3 إيجادها والمتعلقة 
با معايير» والبروتوكولات» والسياسات. والقوانين كانت بطبيعتها ذات آثار تقريبية كونها 
هدفت إلى تثبيت أرضية مشتركة وتعميم الممارسات ونشرها بين المطورين والمستخدمين 
(Lauriault 2012)‏ والتمويه على وتخفيف حدة التوتر والتباين بين قابلية الاستخدام 
وإتاحته Jalg‏ من التخصيص وتقييد الابتكارء ومنع الطرق البديلة لهيكلة وترتيب البيانات 
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(Star and Ruhleder 1996)‏ وبالنظر إلى حدة التوترات» ينبغي التأكيد على عمليات 
التقريب باستمرار وبشكل متكرر من خلال التطبيق» والإدارةء وأنظمة الحوكمة Star and)‏ 
.(Lampland, 2009‏ لذ أكد 112 :1996( (Star and Ruhleder‏ بأنه Y»‏ وجود SS‏ 
مطلق يصدر منه التحكم والمعايير؛ وكذلك. لا أطراف مطلقة ... مع كون البنية التحتية 
شيء ظاهر للناس في الممارسة العمليةء ومتصلا بالأنشطة والهياكل». 


فهذا الظهورء وعلى الرغم من عدم تركزه بشكل كاملء ليس شکلا حراً وهو يتشكل 
من خلال علاقات بنيوية واسعة. فقد 2 Graham and Marvin (2001)J5L‏ بأن البنى 
التحتية هي تأسيسية نتيجة «تراكمات بعيدة المدى من التمويلء والتكنولوجياء والدراية, 
والسلطة التنظيمية والجيوسياسية» (ص. 12) والمحافظة على «الهندسة الفنية الاجتماعية 
للسلطة» (ص. 11) من المصالح الاجتماعية المتحجرة. وتشمل هذه التراكمات أنظمة من 
التشريعات تسعى من الناحية القانونية ومن خلال أشكال الحوكمة لتحديد كيفية إدارة 
وتحليل ومشاركة البيانات» على سبيل JULI‏ قوانين حماية البيانات (انظر الفصل العاشر). 
ولذلك» اقترح )8 :1987( Starr‏ أن البنية التحتية للبيانات لديها: 

نوعان من الهياكل التنظيمية - الاجتماعية والمعرفية: فالتنظيم الاجتماعي يتكون من 
العلاقات الاجتماعية والاقتصادية لأفراد العينة الممثلة. وأجهزة الدولةء والشركات الخاصة, 
والمنظمات المهنية والدولية» وغيرهم من المشاركين في إنتاج تدفقات البيانات من مصادرها 
الأصلية وحتى نقاط التحليلء والتوزيع. والاستخدام» في حين يشير التنظيم المعرفي لهيكلة 
البيانات نفسهاء ها في ذلك حدود الاستعلام: والافتراض عن الواقع الاجتماعيء وأنظمة 
التصنيف. وطرق القياسء والقواعد الرسمية لتفسير وعرض البيانات. 

Dourish and Bell (2007) sius‏ أنه لا هكن النظر بصورة صرفة لقواعد البيانات 
والبنى التحتية كوسائل وأدوات ثانوية لأنها تشمل بطبيعتها نواحي ثقافيةء واقتصادية, 
ومعرفية» وهي غارقة في الأهمية على المستوى الاجتماعي. ولذلك اقترحا منظورين يمكن 
من خلالها فهم البنى التحتية للبيانات: المنظور الأول يتضمن قراءة اجتماعية سياسية 
يدرس من خلالها «بلورة العلاقات المؤسسية» (ص. 416). أما ال منظور الثاني فهو القراءة 
التجريبية التي تدرس " كيفية تشكيل البنى التحتية للبيانات لإجراءات الأفراد وخبراتهم" 
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(ص. (EWV‏ وف كلتا الحاتين» تفهم البنى التحتية للبيانات ككيانات مترابطة. ويُعيد هذا 
الترابط تشكيل العام بشكل عرضي بناء عليهاء وهي بدورها تتشكل من قبل العام كذلك. 
ولي نصل إلى استخدام قواعد البيانات والبنى التحتية للبيانات والاعتماد عليها لفهم 
العام والقيام بأعمال فيهء فإن ممارساتنا المنطقية والمادية ASS‏ وتتمحور كاستجابة لهما 
(Star and Ruhleder 1996)‏ ولا ينعكس العام في البيانات فقط بل يتغير بها؛ «فالعمل 
على إنتاج وحفظ وتبادل البيانات ومشاركتها يقوم بإعادة تشكيل العواط التنظيمية, 
والتكنولوجية» والثقافية من حولهم» )147 :2013 (Ribes and Jackson‏ 

وبعبارة أخرىء لا تدعم قواعد البيانات والبنى التحتية للبيانات البحوث ببساطة, 
ولكنها تغير وبشكل جذري ال ممارسات والنظم البحثية - الأسئلة المطروحة» وكيفية طرحهاء 
وطريقة الإجابة عليهاء وكيفية تطبيق الإجابات» ومن يجري البحث وكيف يعملون بصفة 
باحثين (انظر الفصل الثامن). فعلى سبيل «JULI‏ وف دراستها لتطور التعداد السكاني 
الكندي وأطلس کنداء Lauriault (2012) ca‏ بالتفصيل كيف تطور كل تعداد بشكل 
متواتر ومتكرر على ساس فاذج للعام شكلت b‏ لتصور وعرض كندا. وقد جادلت بأن 
محفوظات البيانات والبيانات نفسها تشكل «نظام ذاكرة خارج الجسم المؤسسي يسمح 
بسرد قصص عن طبيعة كندا... من خلال الخرائط والرسوم البيانية والنماذج والإحصاءات 
التي تعتمد على أجهزة الاستشعارء والبيانات» وقابلية التشغيل البيني» ومعايبر رسم 
الخرائط على شبكة الإنترنت» والبوابات الإلكترونية» والبيانات الوصفية والنماذجء والعلوم, 
والهياكل المفتوحة» (ص. ۲۷). في المقابلء Jis‏ هذه القصص النماذج الأساسية ومن ثم 
البنية التحتية للبيانات. مما يعمل على تحوير الوسائل التي يتم من خلالها إنشاء القصص. 

ويتطلب تفهم قواعد البيانات والبنى التحتية للبيانات التفكيك والتفريغ بعناية لطبيعة 
نشوئهاء وتداخلهاء وعلائقيتهاء. وسياقيتها )1996 .(Star and Ruhleder‏ وهذا يعني البحث 
فيما وصفه )34 :1999( Bowker and Star‏ بأنه انعكاس الأساس Infrastructural)‏ 
(Inversion‏ أي ol‏ ندرك أعماق الترابط بين الشبكات التقنية وامعايير الفنية» من جهة, 
والعمل الحقيقي للسياسة وإنتاج ا معرفة من جهة أخرى. وكما بيّنت )2012( Lauriault‏ 
E‏ هذا Liao Moles Gao] cilia‏ يوق كف E olg E EN EET aulas‏ 
للبيانات مع مرور الوقت وتغير المكان. 
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: (Data Assemblages and the Data Revolution) مجاميع البيانات وثورة البيانات‎ 

كان الجدل والحجة الرئيسية المعروضة في هذا الفصل بأن التفكير بالبيانات لا يكون 
بالطريقة ال مباشرة, ولا هكن أن توجد البيانات بشكل مستقل عن الأفكارء والآليات» 
oL ils‏ والنظم» والناس» والسياقات» بغض النظر عن كونها في كثير من الأحيان يتم 
تصورها بهذه الطريقة )2013 .(Lauriault 2012; Ribes and Jackson‏ فالبيانات يتم 
إنشاؤها بوصفها نتاجاً لكثير من العقول العاملة في مختلف الحالات والأوضاع» وهي مؤطرة 
وتتشكل في ظروف وهياكل مختلفة. 

ولذا فإن من طرق فهم البيانات هو التفكير بها كقضية مركزية لتجمع فني 
اجتماعي معقد. ويتكوّن هذا التجمّع للبيانات من العديد من الأدوات والعناصر 
التي تزداد تشابکاء وتطوراً وتتحوّر مع مرور الزمن وتبدّل المكان Jil)‏ الجدول1-3). 
وتصوغ كل أداة مصحوبة بعناصرها ما هو ممكنء وما هو مطلوبء وما هو متوقع 
من البيانات. وعلاوة على ذلك فهي تتفاعل بعضها مع بعض ويشكل بعضها بعضاً 
من خلال شبكة معقدة ومتغيرة من العلاقات المتعددة الأوجه (انظر الشكل 1-3). 
وكما اذعى كل من )2013( «Ribes and Jackson‏ فإن هذه الأدوات لا تقوم بتأطير 
ماهية وكيفية إنتاج البيانات وإلى Xo (Sl‏ من ال ممكن توظيفها فحسب. ولكنها Jo‏ 
ذاتها منظمة ومدارة لتقوم بإنتاج مثل هذه البيانات. (des‏ ذلك. فإن البيانات 
ومجاميعها تتشارك التحديد (Co-determinous)‏ وتتبادل عملية التشكيل كل منها 
(Mutually Constituted) ,25U‏ وترتبط ببعضها من خلال مجموعة من الممارسات 
والعلاقات المنطقية والمادية الطارئة. والعلائقيةء والسياقية. وعلى ذلك. يختلف كل 
تجميع للبيانات في نسق ترتيب العناصر وسياقهاء ولكنها تتشارك في قواسم مشتركة 
وتأثير كل منها في الآخر بسبب اعتماد الأدوات على بعضها وتداخلها والاتفاقيات التي 
تغطي مجاميع البيانات» ومع نشوء أفكار ومعارف جديدة: واختراع التقنيات» وتطوير 
المهارات» وانفتاح الأسواقء فإن مجاميع البيانات تتطورء وتتحوّرء وتندمج» وتتفكك. 
ونتيجة لذلكء هناك تنوع كبير من تجمعات البيانات عبر النطاقات والاختصاصات 
المختلفة. 
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تصور لمفهوم البيانات 


جدول رقم )١١7(‏ 


الأدوات والعناصر لمجاميع البيانات 


طرائق التفكيرء الفلسفيات. النظريات» النماذج الإيديولوجيات» 
المنطقيات.... إلخ. 
النصوص البحثية» الأدلةء ا مجلات» المواقع الإلكترونية: الخبرةء الخطبء 
منتديات الدردشة.... إلخ. 
نماذج الأعمالء الاستثمارء رأس JUL‏ الاستثماريء المنح, التبرعات والصدقات» 
الربح.... إلخ. 
السياسة» الأنظمة الضريبيةء الرأي العام والرأي السياسيء الاعتبارات 
الأخلاقية.... إلخ. 

الجوانب الإدارية | معايير البيانات» صيغ الملفات» متطلبات النظم» اللوائح البروتوكولية» 

والقانونية القوانين» الترخيصء أنظمة الملكية الفكرية.... إلخ. 

الأوراق / الأقلامء الحاسبات الآليةء الخدمات a8 JI‏ أجهزة الاستشعارء 
الماسحات الضوئيةء قواعد البيانات» شبكات الاتصالء الخوادم... إلخ 
التقنيات. طرق التنفيذء السلوكيات المستفادة. الاتفاقيات العلمية.... إلخ. 
سجلات الأرشفة. الشركات» المستشارون» مصنعونء بائعو التجزئةء الجهات 
الحكوميةء الجامعات. ال مؤتمرات» النوادي والمجتمعات. واللجان والمجالس» 
ا مجتمعات الممارسة.... إلخ. l‏ 
منتجو البيانات. القيّمون على البيانات. المديرونء المحللونء العلماء 
السياسيونء ا مستخدمون. المواطنون.... إلخ. 
المختبرات» المكاتب» مواقع «sil‏ مراكز البيانات» مجموعات الخوادم» 
مجمعات الأعمالء.... والقوى البشرية المتصلة بها. 
للبيانات» ولمشتقاتها (على سبيل المثال» النصوص, الجداولء المخططات» 
الخرائط)» والمحللونء وبرمجيات التحليلء والتفسيرات.... إلخ. 
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الفصل الأول 


فهذا الكتاب يبحث في تجمعات البيانات الناشئة, وا متطورة. ا منتجة للبيانات المفتوحة 
والبنى التحتية للبيانات» والبيانات الكبيرةء وللقيام بذلك يطرح الكتاب ثلاث مسائل رئيسية 
للمناقشة: sl‏ هناك حاجة لتطوير طرق مبدئية وفلسفية لفهم البيانات. فهناك نقص 
ملحوظ في التفكير النقدي والبحثي عن البيانات ds‏ البيانات بحدٌ ذاتها من حيث التكوين 
والتشغيل للمجاميع المحيطة بهاء وعلى الخصوص بالمقارنة مع التركيز والاهتمام اللذين 
تحظى به مفاهيم المعلومات وا معرفة. وذلك على الرغم من أن البيانات هي عنصر أساسي 
في إنتاج المعرفة. Lo‏ هناك ثورة بيانات جارية تعمل على تشكيل لحظة حاسمة في تطور 
وتحوّر تجمعات البيانات. ونظراً لالتقاء العديد من التطورات الناشئة في مجال الحوسبة. 
والتقنيات المنهجية, وا مجالين السياسي والاقتصاديء فإن حجم البيانات» وتنوعهاء dis pas‏ 
ودقتهاء وتوافرهاء والكيفية التي يتم بها معالجة البيانات وتحليلها وتخزينها وتوظيفها 
لزمادة اقيض وتعضيل القينة: قد هد dela lodo Vs od‏ را مخف التحديات 
التقنية والأخلاقية والعلمية التي أثارتها ثورة البيانات» فإن هناك حاجة ialo‏ لتطوير فهم 
مفصل لتجمعات البيانات الجديدة والناشئة التي يتم إنشاؤهاء ولذا تهدف الفصول العشرة 
التالية إلى توفير نظرة إجمالية على نطاق واسع» وشامل» ودقيق لهذه التجمعات وتسليط 
الضوء على القضايا التي تتطلب مزيداً من الاهتمام والبحث. 
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تصور e sal‏ البيانات 


شكل )5-7( 
التقاطع بين أدوات مجاميع البيانات 
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w 


الفصل الثانى 
البيانات الصغيرة «(Small Data)‏ والبنى التحتية OGLU‏ 
«(Data Infrastructures)‏ ووسطاء البيانات (Data Brokers)‏ 


قبل بضع سنوات مضت كان مصطلح «البيانات الصغيرة» نادر ا إن ۾ يكن 
و وقد ذاع انتشاره مضا بحكم الواقع على النقيض مما سمي «البيانات الكبيرة». 
فكل البيانات كانت في الواقع بيانات صغيرة ومن ثم لم تتطلب تمييزها بهذا الإصطلاح. 
وسيجري لاحقا مناقشة ما eB‏ على تأسيس البيانات الكبيرة بالتفصيل في الفصل الرابع» 
ولكن من الضروري تسليط الضوء على الفرق بين البيانات الصغيرة والبيانات III‏ وذلك 
قبل التوجه إلى مناقشة كيفية 52d‏ البيانات الصغيرة من خلال البنى التحتية الجديدة 
للبيانات والأسواق اللمقدّرة ببلايين الدولارات» كما سيتم Goy‏ في الفصل التالي مناقشة 
انفتاحها لتقبل المشاركة وإعادة الاستخدام. 

فمن الناحية التقليديةء ونظراً للتكاليف والصعوبات المصاحبة لعمليات إنتاج ومعالجة 
وتحليل وتخزين البيانات» فقد تم إنتاج البيانات الصغيرة بطرق مضبوطة بأحكام باستخدام 
تقنيات أخذ العينات التي iad‏ من نطاقهاء وصلاحيتها الزمنية. وحجمها )2010 (HJ. Miller‏ 
وبينما هكن أن تكون بعض قواعد البيانات كبيرة جداً في الحجم, مثل قاعدة بيانات التعداد 
الوطني» ولجعل ممارسة تجميع هذه البيانات قابلة للإدارة» فإن عملية إنتاجها عادة ما تتم 
خلال بضع سنوات وتكون محدودة النطاق å)‏ حالة التعداد. يجرى في العادة مرة واحدة كل 
عشر سنوات ويكون مقتصراً على ثلاثين إلى أربعين سؤالاً فقط). وعلاوة على ذلك فقد كانت 
دقة البيانات الصغيرة العامة (Small Tertiary Data)‏ في كثير من الأحيان ضعيفة جداً (كانت, 
على سبيل JELI‏ على مستوى المقاطعات أو الدول وليس الأفراد والأسر). كما أن الأساليب 
المستخدمة لإنتاجها غير مرنة على الإطلاق (على سبيل «JULI‏ من ا مستحيل تعديل الأسئلة أو 
الإضافة لها أو الإزالة منها مجرد التهيئة للتعداد وإعداده والبدء بإدارته لأن ذلك سينعكس 
سلباً وبشكل Gar‏ على القدرة على ا معالجة والتحليل). وفي المقابلء تتميز البيانات الكبيرة 
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الفصل الثاني 


بكونها تنتج بشكل مستمر» وتسعى لأن تكون شاملة وغارقة في التفاصيل ودقيقة على مستوى 
النطاق الذي تغطيه. ومرنة وقابلة للتطوير في عملية إنتاجها (انظر الجدول 2-1 والفصل 
الرابع). 


جدول رقم (Y-V)‏ 


مقارنة البيانات الصغيرة والبيانات الكبيرة 


= 


TOI 
م محدودة ال واسعة‎ 
الوقت الذي تعد فيه البيانات الصغيرة واحات صغيرة ضمن صحارى البيانات»‎ (35 

تنتج البيانات الكبيرة طوفان بيانات حقيقي. وقد أذى ذلك بالبعض إلى التساؤل عما إذا 
كانت البيانات الكبيرة قد تؤدي إلى زوال البيانات الصغيرة أو تضاؤل مكانة الدراسات التي 
تعتمد على البيانات الصغيرة نظراً لمحدوديتها في الحجم, والنطاق» والصلاحية الزمانية. 
فقد لاحظ )2008( Sawyer‏ أن وكالات تمويل البحوث الأكادمية. على سبيل «JULI‏ توجه 
موارد التمويل المحدودة الخاصة بها إلى مجالات البيانات الغنية على نحو متزايد. وذلك 
رها بسبب التداخل بين حجم البيانات وسرعتها مع مقدار التبصر والتوظيف والقيمة, 
وأن هذه الوكالات تحول الأسئلة البحثية التي من الصعب أن تنتج بيانات كبيرة لجهات 
التمويل الأخرى المتعددة وتمنحها وضع هامشي داخل وخارج هذه اللمؤسسات الأكاديمية. 
Dosis‏ فن الجوت EE‏ ققد اسكمل هنا الفعراك من خلال de ch‏ العديد من وكالات 
التمويل نحو البحوث التجريبية التطبيقية ذات الشراكة الصناعية. وقد أدى إعادة الترتيب 
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البيانات الصغيرة, والبنى التحتية للبيانات» ووسطاء البيانات 


لأولويات البحث إلى سوء الفهم لطبيعة البيانات الكبيرة وقيمة البيانات الصغيرة» فالبيانات 
الكبيرة رها تهدف إلى أن تكون شاملةء ولكن كما هو الحال مع جميع البيانات فإن كليهما 
o ġe pU‏ تمثيل eT‏ وعينة (Sample)‏ فماهية البيانات التي يتم التقاطها 


٠‏ مجال إطار عرض/ أخذ العينات (حيث يتم توظيف أجهزة التقاط البيانات وماهية 
إعدادات التهيئة لها/ ومعاملاتها؛ مثل من يستخدم المكان أو وسائل الإعلام» وعلى سبيل 
JULI‏ من الذي ينتمي إلى وسيلة التواصل الاجتماعي الفيسبوك أو يتسوّق في محلات 
وول مارت...إلخ). 

o‏ التقنية والمنصة المستخدمة (المسوحات المختلفة. وأجهزة الاستشعارء والعدسات» 
والمطالبات النصيةء والمخططات والتصاميم... إلخ» وكلها تنتج فروقا وتباينات في ماهية 
البيانات التي يتم إنشاؤها). 

e‏ السياق الذي يتم إنشاء البيانات فيه (الأحداث الجارية تعنى أن البيانات Ulo giis‏ نسبة 
إلى الظرف الذي تقع فيه). 

o‏ تبويبات (أنطولوجية) البيانات ا مستخدمة LAS)‏ معايرة البيانات وتصنيفها). 

ه البيئة التنظيمية فيما يتعلق بالخصوصيةء وحماية وأمن البيانات. 

وتلتقط البيانات الكبيرة في العموم ما هو سهل التقاطه - أي البيانات التي يتم التعبير 

عنها علناً «cas ls)‏ 05554 ومسح diss‏ وما تم م استشعاره.. . إلخ؛ وتصرفات الناس وسلوكهم؛ 

وحركة الأشيا (s‏ - وكذلك البيانات ال مستنفذزة والتي هي ناتج وظيفة رئيسية وليست ال مخرج 

«ou‏ والبيانات الوصفية التي e‏ م إنشاؤها ub‏ وتأخذ البيانات الكبيرة هذه البيانات 
بالقيمة الاسمية» على الرغم من أنها قد لا تكون قد تم تصميمها للرد” على أسئلة محددة 

والبيانات الناتجة قد تكون عشوائية وغير دقيقة (انظر الفصل التاسع). 

أما البيانات الصغيرة فقد تكون محدودة في الحجم والسرعة. ولكن لديها تاريخاً طويلا 
من التطوير. مع منهجيات مقررة وأطوار للتحليل» وسجل حافل من الإجابات الناتجة للأسئلة 
العلمية. ويمكن لدراسات البيانات الصغيرة أن تكون مصممة بشكل أفضل بكثير للرد على 
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الفصل الثاني 


أسئلة بحثية محددة والاستكشاف Maab‏ والمعمُق للطرق المتنوعة» والسياقيةء والمنطقية 
وغير المنطقية التي يتعامل بها الناس» ويتم فهم العام بهاء وكيفية عمل العمليات العلمية 
(انظر الفصلين الثامن والتاسع). ويمكن أن تركز البيانات الصغيرة على حالات محددة وتخبر 
عن قصص فرديةء وسياقيةء ودقيقة. وبسبب Uil‏ تستهدف ظاهرة معينةء فهي تركز بشكل 
مكثف على قضية وعادة ما تكون أقل حاجة للموارد بشكل مكثف: وتسعى دراسات 
البيانات الصغيرة على التنقيب عن الذهب من خلال العمل في شق ضيق للغايةء في حين 
تسعى دراسات البيانات الكبيرة إلى استخراج شذرات من خلال التعدين في حفرة مفتوحة 
وشفط وغربلة مساحات شاسعة من الأراضي. ومن ثم فقد برهن )2008( Sawyer‏ على أن 
التمويل يحتاج إلى استهداف الإجابة عن الأسئلة الحرجة» سواء كانت معالجتها باستخدام 
بيانات صغيرة أو كبيرة» وليس مجرد أن توجّه نحو المشاريع التي يمكنها الوصول إلى كميات 
هائلة من البيانات على أمل أنها تحوي بطبيعتها رؤى وأفكاراً مفيدة. 

وهكذاء يمكن القول إنه من ا ممكن تحصيل المزيد من القيمة والرؤى من البيانات 
الصغيرة من خلال توسيع نطاقها إلى مجموعات بيانات SÍ‏ وجعلها متاحة لإعادة 
الاستخدام من خلال البنى التحتية للبيانات الرقمية والتي تجعلها إضافة إلى ذلك قابلة 
مختلف أشكال التحليل الحسابيء والحفاظ عليها للأجيال القادمة. ونتيجة لذلك» وكما هو 
الحال مع البيانات الكبيرةء فقد استثمرت موارد كبيرة في السنوات الأخيرة لإنشاء مثل هذه 
البنى التحتية للبيانات» والتي أحدثت تغييرات كبيرة في مشهد البيانات. 


حاويات البيانات «(Data Holdings)‏ محفوظات البيانات «Data Archives)‏ 
والبنى التحتية للبيانات :(Data Infrastructures)‏ 
تم جمع البيانات معا وتخزينها لفترة طويلة من التاريخ المسجّلء وقد كانت هذه 
ا ممارسات غير رسمية ورسمية على d>‏ سواء في طبيعتهاء فا ممارسات غير الرسمية تتكؤن 
abl aua‏ من gaz‏ البيانات وتغزينهاء حن سكن اللمازسات الرسمية من مجموعة 
اممارسات الفاعلة ذات العلاقة بإدارة دورة حياة البيانات (Data Curation)‏ والهياكل 
امؤسسية ا لمصممّة لضمان الحفاظ على البيانات من أجل الأجيال القادمة. وقد يكون من 
الأفضل وصف اممارسات غير الرسمية بأنها حاويات البيانات» في حين أن الممارسات الرسمية 


5 ثورة البيانات البيانات الكبيرة» والبيانات المفتوحة, والبنى التحتية للبيانات» والنتائج المترتبة عنها 


البيانات الصغيرة, والبنى التحتية للبيانات» ووسطاء البيانات 


هي محفوظات (أرشيفات) البيانات. ويجريء في كثير من الأحيانء الخلط بينهما أو تستخدم 
بالتبادل» Uie‏ إلى جنب مع غيرها من ا مصطلحات مثل النسخ الاحتياطي Backup)‏ 
وبنك المعلومات «(Information Bank)‏ ومستودع البيانات «(Data Repository)‏ ولكن 
المحفوظات الأرشيفية تمتلك خضاتص مميزة جدا عند أمناء المحفوظات (Archivists)‏ 
المهنيين. 

فالمحفوظات هي مجموعات رسمية منظمة من البيانات التي يتم هيكلتها وتوثيقها 
ونشرها بشكل فعالء مصحوبة بالبيانات الوصفية المناسبة لهاء مع التخطيط الفعال لقضايا 
ا محافظة عليها وإتاحة الوصول إليها وإمكانات اكتشافها )2013 .(Lauriault et al.‏ 
فالمحفوظات تهدف بشكل واضح وصريح وطويل «ul‏ للحفاظ على البيانات لإعادة 
استخدامها في المستقبل. إن مفهوم الحفاظء في هذا السياق» لديه استخدام خاص محدّد على 
أنه مجموعة من الأنشطة المدارة والمدعمّة «بالمبادئ. السياسات» القواعد, والإستراتيجيات 
الرامية إلى إطالة أمد الكائن (البيانات) من خلال المحافظة عليه في حالة مناسبة للاستخدام, 
سواء على شكله الأصلي أم في شكل مُستدام ]35 ثباتاء مع الإبقاء على الشكل الفكري 
للكائن» )2013 ,2 .(InterPARES‏ ويسعى الأرشيف للحفاظ على مجموعة سجلات كاملة, 
وليس مجرد البيانات؛ أي أنها تشمل كل الوثائق الداعمة والبيانات الوصفية وغيرها من 
ا مواد ذات الصلة التي تحتوي على تفاصيل المنشأ والسياق فيما يتعلق بكيفية إنتاج البيانات 
والطريقة التي ينبغي أن تعامل وتحلل وتفسّر بها. فالنهج المتبع في الحفاظ على البيانات 
مبني على الإدراك التام ob‏ التقنيات والبروتوكولات والمبادئ التوجيهية لأفضل الممارسات 
هي عرضة للتغيير والتقادم» بمعنى أن البيانات سوف تحتاج للتنقل والترحيل عبر منصات 
وتقنيات بسبب الابتكارات الجديدة التي تأني في السياقء كما يدرك النهج المتبع بأنه دون 
ممارسات فعالة لإتاحة وإعادة الاستخدام والمشاركة للبيانات فإن البيانات معرضة للتلف» 
أو الضياع. أو الحرمان من بياناتها الوصفية السياقية والوثائق الداعمة );2007 Borgman‏ 
.(Dasish 2012‏ ويسعى المحفوظ الأرشيفي إلى توفير موارد جديرة بالثقة. من خلال الحفاظ 
على سلامة البيانات (Data Integrity)‏ مع مرور الوقت. 


وق بعض الحالات. قد يلزم مؤتمنو البيانات (Data Custodians)‏ مسؤولية قانونية 
لحفظ وأرشفة البيانات بشكل مناسب لإعادة الاستخدام الحالي والمستقبلي: كما قد يكون 
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المؤتمن على الأرشفة والقائم عليها نفسه سلطة قانونية تشريعية. فعلى سبيل «JULI‏ 
فإن المحفوظات الأرشيفية الوطنية والوكالات الإحصائية الوطنية هي الكيانات القانونية 
التي غهد إليها جمع وإنتاج وأرشفة قواعد بيانات محددة مثل السجلات الشخصية 
للأفراد والحسابات القوميةء والتعدادات والمسوح السكانية. وينبغي أن تمتثل محفوظات 
أيضاً للتشريعات المتعلقة بحقوق الوصول إلى البيانات» والخصوصية. والمبادئ الأخلاقية, 
وحقوق الطبع والنشرء والملكية الفكرية» وتحديد المسموح لهم للوصول إلى البيانات وما 
يمكنهم القيام به من خلال تحديد الصلاحيات على البيانات. على سبيل المثالء في العديد 
من البلدان» من الممكن نشر سجلات التعداد في شكل إجماليء مع تقييد نشر السجلات 
الشخصية إلى ما بعد مئة ple‏ فالالتزام بإتاحة الوصول وإعادة الاستخدام للبيانات لا يستلزم 
بالضرورة العمل على نموذج مفتوح (انظر الفصل الثالث)ء ولكن ينبغي أن يتم ضمان توافر 
البيانات في ا مستقبل للمجتمع المستهدف بطريقة قانونية )2012 .(CCSDS,‏ إن المجتمع 
المستهدف هو عادة مجموعة معينة من العلماء أو المتخصصين في مجال السياسات الذين 
لديهم في العادة احتياجات محددة تماماً من البيانات» ومتطلبات وظيفية ودعم مما يعني 
أن حلول الأرشفة العامة ستكون ذات فائدة محدودة )2013 (Lauriault et al.‏ 

ومن ثم» فإن محفوظات البيانات ليست مجرد مخازن بيانات أو أنظمة نسخ احتياطي 
(والتي تحفظ البيانات في حال حدوث أعطال على المدى القصير مثل عطل الوسط التخزيني 
أو الفشل التقني)ء ولكنها تُخططء وتنسشّقء ودار وتوظف بفعالية من قبل gibas‏ 
متفرغين ومتخصصين يعملون على إضافة القيمة وضمان الاستمرارية. فهؤلاء الأفرادء إضافة 
إلى الكيان الإداري الوظيفي» مسؤولون عن الأرشفة إضافة إلى ثلاث مجموعات أخرى من 
الأطراف الفاعلة في عملية الأرشفة وهم: منتجو البيانات» ومستهلكو البيانات» والإدارة 
.(CCSDS 2012)‏ فاممنتجون هم منشئو البيانات أو الكيان القانوني المسؤول عن إنتاجها؛ 
أما المستهلكون فهم مستخدمو ال محفوظات. وأصحاب المصلحة المعنيون بها أو مجتمع معين؛ 
وأما الإدارة فهي الهيئة التي تقرف ue‏ العملية 53939 للأرقيف (Bo‏ ونظاقاء ولكنها لا 
تأخذ à las lisa‏ عمليات الأرشفة اليومية )2013 .(CCSDS 2012; Lauriault et al.‏ 
وتشكل هذه الدوائر مجتمعة كيفية بناء وتشغيل وتطوير الأرشيف مع مرور الوقت. 
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في «JSt‏ فإن حاويات البيانات هو مجموعة غير رسمية وغير نظامية من البيانات. 
وقد يعتد بعض منتجي البيانات أن النسخ الاحتياطي أو أنظمة التخزين تشكل محفوظات 
أرشيفية بحكم الواقع» ولكنها تفتقر إلى الجهاز المؤسسيء والتنظيم» والسياسات الرسمية 
النظامية (بالنسبة إلى المعاييرء وإتاحة الوصول إليهاء وإمكانية إعادة استخدامهاء وحقوق 
الملكية الفكرية, وال معايير الأخلاقية, وإلى آخره). وما يطمح إلى تحقيقه الأرشيف Lauriault)‏ 
.(etal. 2013‏ فقد تكون حاويات البيانات منتظمة ومَوجّهة: ولكن بدون قواعد صارمة 
أو أي خطط طويلة المدى تتعلّق با محافظة على البيانات وحفظهاء ودون أي التزام مشاركة 
البيانات وتبادلها أو جعلها متاحة لإعادة الاستخدام. وعلى الرغم من أن حاويات البيانات 
قد تلتزم بشكل جيد بمعايير البيانات المتوقعة:. إلا أن هذا الالتزام يفتقر إلى الاعتماد 
والمصادقة عليه ويفتقر إلى الوثائق الأخرى والبيانات الوصفية المناسبة. 

وقد فقدت معظم البيانات التي تم إنتاجها على مر التاريخ أو C83‏ بسبب تخزينها 
في حاويات بيانات» وليس أرشيفاء أو لأنه تقرر الحفاظ على المعلومات المستقاة من هذه 
البيانات (مثل المقالات والكتب) التي كانت تعد أكثر قيمة» وتخزينها في المكتبات. وبشكل 
عام تم الإبقاء فقط على مجموعات البيانات SUI‏ قيمة» مثل تلك المرتبطة بالمساعي 
العلمية والثقافية الأساسية والسجلات الحكومية» وال معاملات الاقتصادية» والعقود القانونية. 
وفي حالات النماذج» الفنونء الكائنات ....إلخ والتي هكن اعتبارها صوراً معينة من البيانات 
فقد تم تنسيقها وتخزينها بالأساس في المتاحف وصالات العرض Ue‏ إلى جنب مع البيانات 
الوصفية المرتبطة بها. وقد تم تخزين البيانات الخاصة بمعظم العلماء بشكل غير رسمي 
على ملفات وصناديق أو على مختلف محركات الأقراص الصلبة في مكاتبهم أو في منازلهم. 
وعندما يتقاعدون خارج الخدمة أو يتوفون يتم تدمير معظم آثارهم» ومعهم أي بيانات 
قاموا بإنتاجها. كما أن الغالبية العظمى من البيانات التي تم إنتاجها لأطروحات الدكتوراه 
تفقد بعد الانتهاء منهاء وغالباً لا يتم نشر حتى المعلومات المستقاة من البحوث. وعلاوة 
على «dS‏ فإن as‏ 5 البحوث تاريخياً م يطالبوا المشاريع التي قاموا بتمويلها بحفظ 
البيانات وتخزينهاء أو إن طلبوا ذلك فقد كان لفترة قصيرة من الزمن. وكما هو الحال في 
العديد من المشاريع التي يموّلها الاتحاد 3959« يُشترط الاحتفاظ بجميع مواد المشروع 
ما في ذلك البيانات لمدة سبع سنوات» ولكن يمكن بعد ذلك التخلص منهاء وهو ما يتم في 
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كثير من الحالات. بسبب تكاليف التخزين والظن الغالب ob‏ المقالات الورقية الناتجة تمثل 


ومع تطور حلول التخزين الرقمي» التي قللت التكلفة والمساحة التخزينية للاحتفاظ 
بالبيانات» فقد بدأ التخزين الطويل الأمد على نطاق واسع للبيانات الاعتيادية ا منخفضة 
التكلفة (انظر الفصل الخامس). فقد ظهرت أولى قواعد البيانات الرقمية التي ضمّت 
مجموعات البيانات في الخمسينيات والستينيات من القرن الماضي وكانت تنسّق البيانات 
2 هياكل "ES NT‏ أو هرمية منظمة )2012 .(Driscoll‏ ومع «eL JS‏ فقد كانت هذه 
الترتيبات غير فعالة للبحث والاستعلام عن البيانات» كما تم تطوير قواعد البيانات العلائقية 
(Relational databases)‏ ابتداء في عام ۱۹۷۰ من قبل إدغار كود (Edgar Codd)‏ وقد 
نظم خصائص البيانات المميزة (Attribute)‏ في مجموعة من الجداول dol ll‏ حيث يتشارك كل 
جدول بحقل بيانات واحد على الأقل مع جدول آخرء فعلى سبيل المثال» قد يكون رقم الضمان 
الاجتماعي هو الحقل المشترك بين جدولين (المفتاح التأشيري- (Indexical Key‏ أحدهما يحتوي 
على التفاصيل الشخصية (مثل العم الجنسء الحالة الاجتماعيةء والعنوان) ويحتوي الجدول 
الآخر على المتعلقات AIL‏ ويسمح رقم الضمان الاجتماعي بربط البيانات للاستعلام في 
كلا الجدولين ba‏ وإنتاج بيانات جديدة مشتقة منهما. وإذا كان المفتاح المشترك عنواناً 
m‏ فيمكن عندها وضع البيانات جغرافياً أف واف همت ibl d agi‏ 
العلائقية قنظيماً Gs ul‏ أك فحالة وعقيداً عن البيانات الهيكلية باستخدام لغات 
الامتعلام الهيكلية (SQL)‏ وجنباً إلى جنب مع قواعد البيانات العلائقية سمح تطوير 
البيانات المجدولة (Spreadsheets)‏ بتنظيم وتخزين كميات كبيرة من البيانات الحسابية 
إضافة لتطبيق الصيغ والمعادلات عليها مما يؤدي إلى إنتاج بيانات مستقاة جديدة. وقد 
استكملت هذه الأشكال من قواعد البيانات» في السنوات الأخيرةء بقواعد البيانات غير 
الهيكلية (بلا استعلام (-noSQL.‏ التي يمكنها التعامل مع كميات كبيرة من البيانات غير 
الهيكلية (انظر الفصل الخامس). 

ويكون إنشاء ونمو مجموعات البيانات سهلاً في الحالات التي تنتج فيها البيانات ابتداء 
بصورة رقمية (نشأت بالكود الثنائي-ع2»0 (binary‏ وأحيانا بطرق تلقائية ومؤتمتة. كما 
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أنها عرضة للخسارة بشكل كبير بسبب التقادم في البرمجيات وا معدات. وقد بين O'Carroll‏ 
and Webb (2012)‏ أنه: «في حين يمكن لأي أحد التقاط كتاب كتب قبل مئة «Aus‏ والنظر 
فيه. وقراءة صفحة «tia‏ فإنه لن يكون ذلك بالمثل صحيحاً لقرص مرن يحتوي على ملفات 
dua‏ لبرمجيات وورد بيرفكت أنشئت قبل ٠١‏ سنة فقط». وف المقابلء ينبغي أن تحول 
الأشكال التناظرية/ التماثلية للبيانات إلى الصورة الرقمية الثنائية على سبيل «JUI‏ مسحها 
ضوئياً أو إعادة تسجيلها وإدخالهاء والتي يمكن أن تكون مكلفة وتستغرق وقتاً طويلا 
على الرغم من إمكانية أتمتة هذه العملية UT‏ إلى حد ما. وقد حدّت التكاليف والنفقات 
ال مرتبطة بالرقمنة (Digitisation)‏ من حيث التكلفة المادية. وقت الموظفينء وا لمعدات 
ا متخصصة. من تطبيقها في العديد من المحفوظات الأرشيفية التناظرية التي تحتفظ بها 
المتاحف والمكتبات وال مجموعات الشخصية الخاصة. وبينما كافحت هذه المؤسسات لتمويل 
أنشطة الرقمنةء فإن جهات خيرية غير ربحية Jis‏ أرشيف الإنترنت (http://archive.org)‏ 
وتجارية مثل قوقل (Google)‏ تساعد على القيام مثل هذه الأنشطة, وذلك باستخدام 
مواردها الذاتية أو تبرعات المحسنين من عامة الأفراد مما يجعلها متاحة مجانا للجميع 
(انظر الفصل الخامس). 

وفي جميع الحالات» فإن البيانات ضمن حاويات البيانات الرقمية وا محفوظات الأرشيفية 
يمكن مشاركتها وإعادة استخدامها بسهولة وبتكلفة هامشية منخفضة» وذلك على الرغم 
من أنه من الممكن Jodl‏ فيما يتعلق بالوصول وإعادة الاستخدام بواسطة سياسات حقوق 
ال ملكية الفكرية. وعلاوة على «SUS‏ فإنه من الممكن معالجتها وتحليلها من خلال الأدوات 
الحسابية القويةء إذ أصبحت الإجراءات والحسابات التي كان من الصعب القيام بها يدوياً 
أو باستخدام التقنيات التناظرية على سبيل «JULI‏ المسطرة الحاسبة التناظرية Slide)‏ 
(rules‏ ممكنة في غضون بضعة أجزاء من الثانيةء وأكثر في بناء واختبار النماذج وأنظمة 
ااك ads‏ كما مكن Lad‏ رط else‏ البيانات الرقسة col gos‏ الأرشيفية يها 
بسهولة نسبياً ومدّها إلى أشكال أخرى من البنى التحتية للبيانات. 

فالبنية التحتية للبيانات هي الوسيلة المؤسسية وامادية والرقمية لتخزين وتبادل 
واستهلاك البيانات عبر التقنيات ال مرتبطة بعضها ببعضء وعلى مدى العقدين ا ماضيين على 
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وجه الخصوص» فقد تم بذل جهد كبير لتطوير وتعزيز هذه البنى التحتية» والتي تأخذ 
عدة أشكال: الكتالوجات, والأدلة: والبوابات» ومراكز تبادل المعلومات. وا مستودعات» 
والمستودعات الرقمية الموثوقة. والبنى التحتية السيبرانية Cyber-Infrastructures)‏ 
.(Lauriault et al. 7‏ وغالباً ما تستخدم هذه المصطلحات بالتبادل ويجري الخلط 
بعضها ببعضء وذلك على الرغم من أنها تمثل أنواع مختلفة من الكيانات (انظر الجدول 
2 على سبيل (JULI‏ 

فالكتالوجات. والأدلةء والبوابات هي موارد مركزية تفصّل وتربط حاويات البيانات 
والمحفوظات الأرشيفية التي تحتفظ بها المؤسسات على المستوى الفردي. وقد توفر قوائم 
مفصلة إلى Xo‏ ما عن مجموعات البيانات التي تضمّهاء كما هكن أن تكون هثابة مجاميع 
للبيانات الوصفية. ولكن لا يستضيف المموقع نفسه البيانات )2013 .(O' Carroll et al.‏ 
أما مستودع البيانات أو مركز تبادل ا معلومات فهو مكان مشترك لتخزين حاويات البيانات 
وا محفوظات الأرشيفية والوصول إليها. وقد توفر هذه المستودعات والمراكز بعض خدمات 
البيانات من قبيل البحث والاسترجاع: وإدارة البيانات ومعالجتهاء ولكن عملية إنتاج كل 
حاوية أو أرشيف تتم بشكل مستقلء ولذا فهي رها تفتقر إلى صيغ ومعايير وبيانات وصفية 
وسياسات مشتركة للبيانات. ومع EUS‏ يسعى مستودع البيانات لضمان التزام كل أرشيف 
أو حاوية بمجموعة من المواصفات المطلوبة ويقوم بالمراجعة» والتدقيقء والتصديق على 
منح الشهادات لضمان سلامة البيانات وتعزيز الثقة بين المستخدمين )2012 .(Dasish‏ 
وعرّف )2013( O'Carroll et al.‏ نوعين من ال مستوعات. مستودعات الموقع الواحد التي 
تستضيف كافة مجموعات البيانات في موقع «Alo‏ ويمكن الوصول إليها من خلال واجهة 
على شبكة الإنترنت» على الرغم من إمكانية احتفاظها بنسخ احتياطية أو مواقع مثيلة في 
أماكن متعددة. والمستوعات المتعددة المواقع التي تستضيف البيانات ضمن هيكل موحد 
يسمح بالوصول إلى مجموعات البيانات AUI‏ في عدد من المواقع المؤسسية. 


فا مستوع الرقمي الموثوق (TDR - Trusted Digital Repository)‏ هو مستودع 
مرخص موقع واحد أو متعدد المواقع تتمثل مهمته في توفير وصول آمن وموثوق به 
للبيانات التي يديرها على المدى البعيد )2002 .(RLG and OCLC‏ ومن أجل التأهل 
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كمستودع موثوق» فصلت )5 :2002( RLG and OCLC‏ الخصائص المطلوب توفرها في 

البنية التحتية لهذه المستودعات وهي كالتالي: 

e‏ تقبل المسئولية عن الصيانة طويلة الأمد للموارد الرقمية بالنيابة عن مودعينء وما فيه 
مصلحة ال مستخدمين الحاليين والمستقبليين» والمستهلكين أو ا مجتمعات المعنية. 
البعيدء ولكن يحافظ أيضا على المعلومات الرقمية التي تقع ضمن نطاق مسؤوليته. 

٠‏ توضيح المسؤولية المالية وضمان الاستدامة. 
تصميم أنظمتها وفقاً للاتفاقيات وا معايير المقبولة والمعتمدة لضمان الإدارة المستمرة 
والوصولء وأمن المواد المودعة داخلها. 

* وضع منهجيات لتقييم المستودع» وذلك للتأكد من تلبيته للتوقعات المجتمع من حيث 
الموثوقية. 

o‏ إمكانية الاعتماد على البنية التحتية الخاصة بها وضمان تحمّل مسؤولياتها على ا مدى 

e‏ امتلاك السياسات» وامممارسات» والأداء الذي يمكن تدقيقه وقياسه. 


ولي يمكن لمستودع ما الحصول على هذه المتطلبات», أكدت RLG and OCLC‏ 
)13 :2002( أنه ينبغي أن يكون متوافقاً مع النموذج ال مرجعي لنظام المعلومات الأرشيفي 
المفتوح )2012 (OAIS Open Archival Information System-)(CCSDS‏ وأن متلك 
ا مسؤولية الإدارية» والسلامة التنظيمية» والاستدامة AJU‏ واطلائمة التقنية ls ls‏ 
وأمن النظام» وا مساءلة الإجرائيةء وتساعد كل هذه الخصائص معا على ضمان وبناء الثقة 
في البيانات ومستودعها. 

dots‏ البنية التحتية السيبرانية أكثر من مجرد مجموعة من المحفوظات الأرشيفية 
الموثوقة فهي KE‏ من تبادل البيانات والتشارك في موارد البنية التحتية باهظة الثمن. 
وتتألف البنية التحتية السيبرانية من مجموعة متكاملة من المعدات المتخصصة والتقنيات 
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الشبكية (تشمل المراصد والمرافق البحقية التجريبية: وشبكات الاستشعار. وما إلى (aU‏ 
والخدمات والأدوات لبرمجيات التشغيل المتبادل والبرمجيات الوسيطة. والخدمات المشتركة 
(المتعلقة بإدارة البيانات ومعالجتها). وأدوات التحليل مثل التمثيل البصري للبيانات 
(غلى سبيل «JULI‏ تطبيقات الرسوم البيانية ورسم الخراقط): والسياسات المشتركة (فيما 
يتعلق بحق الوصول للبيانات واستخدامها وحقوق الملكية الفكريةء وغيرها) التي تمكن 
من نشر البيانات وتوزيعهاء وربطها بعضها مع بعض وتحليلها (هيئة البنية التحتية 
السيبرانية 2007 .(Cyberinfrastructure Council‏ كما تسعى إلى تعزيز تنمية ا مجتمع 
الثقافي الذي يدعم التعاون المباشر بين الأفراد متجاوزاً الحدود الجغرافية والمؤسسية 
.(Cyberinfrastructure Council 2007)‏ وبينما تستخدم bs‏ لوصف البنية التحتية 
التي تمكن عمل مستودع بيانات موحدء فإنها تستخدم هنا للدلالة على البنية التحتية 


وبعبارة أخرىء هناك قواعد صارمة متعلقة بتطبيق المعايير على البيانات والالتزام بها داخل 
البنية التحتية. وتشمل مثل هذه البنى التحتية السيبرانية تلك التي تنفذها الوكالات 
الإحصائية الوطنية والبنى التحتية اممكانية الوطنية للبيانات. إضافة إلى البنى التحتية 
العلمية واسعة النطاق التي تتعلق بأبحاث الجينات» وعلم الفلكء والأرصاد الجوية وغيرهاء 
والتي تتطلب تخزين كافة البيانات ومشاركتها مع الامتثال لمعايير محددة من أجل تحقيق 
أقصى قدر من قابلية التشغيل البيني للبيانات وضمان جودة البيانات» والإخلاص والنزاهة 
التي تعزز الثقة. وهذه الأخيرة لها أهمية خاصة في مجال العلوم» والسياسات التي تقوم 
على أساسها مثل تتبّع تغيرات المناخ clus‏ حيث تعد سلامة البيانات أمرا بالغ الأهمية 
في المناقشات الجارية حاليا. 

وإضافة إلى بوابات البيانات» والمستودعات. والبنى التحتية» تم استحداث عدد من 
ا منظمات والهياكل المؤسسية التي تقدم المشورة بشأن أفضل ال ممارسات في مجال الحفظ 
الرقمي» وإتاحة ومشاركة البيانات» والتحقق من صحة العمل وامعايير المتعلقة بالأنواع 
المختلفة من بنوك البيانات» والدفع باتجاه تنميتها وتطويرهاء وتنسيق الجهود المختلفة 
بشأن ذلك (انظر الجدول 2-3). وتؤدي هذه ال منظمات والهياكل المؤسسية عملها من خلال 
أنشطة عدة مثل تقديم البرامج التدريبية والتعليمية» واستضافة الندوات والمؤتمرات» وإنتاج 
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الكتيبات والأدلة» وتوفير التمويل اللازم لمبادرات محددة. وتكتسب هذه المنظمات أهمية 
نظراً لإمهاماتها في خلق مجتمعات الممارسة بين مختصي البيانات» وتسهيل المفاوضات بين 
الهيئات وتوسيع نطاق الجهود المؤسسية. ووضع مبادئ توجيهية ومعايير مشتركة. ويركز 
بقية هذا القتسم على مستودعات البيانات البحثية والبنى التحتية» ويفصّل في الأسس 
المنطقية لها والتحديات التي تواجههاء كما ستتم مناقشة البنى التحتية الخاصة والمتعلقة 
بشركات البيانات التجارية في وقت لاحق في هذا الفصل. 


جدول رقم (Y-Y)‏ 
أنواع وأمثلة البنى التحتية للبيانات 


يُطلق على مجموعات غير رسمية من ملفات البيانات التي تكون على جهاز حاسب 
شخصيء ويسمى نظام النسخ الاحتياطي في بعض الأوقات. 


às cà jl‏ لبيانات الصور (LONI Image Data Archive-IDA)‏ هو أرشيف 
آمن لصور الجهاز العصبي والبيانات السريرية الطبية ذات الصلة با مشاريع البحثية 
في جميع أنحاء القارة الأمريكية الشمالية والقارة الأوروبية. 
أرشيف الموسيقى العالمية الموجود في مكتبة موسيقا لويب (Loeb)‏ في جامعة 
هارفارد الذي يقدّم تخزيناً Lal‏ ووصولاً متاحاً محتوى الأرشيف والتسجيلات 
التجارية الصوتية والمرئية للموسيقى من جميع أنحاء العام. 


تمكن خدمة البيانات الوطنية الأسترالية المستخدمين من تصفح أكثر من أربعمائة ألف 
من مجموعات البيانات وأكثر من ثلائمائة ألف مشروع تقوم بإنشاء مجموعات البيانات. 


تتيح مكتبة الرقمية العامة الأمريكية الوصول إلى مليونين وخمسمائة ألف سجل من 
سجلات البيانات الوصفية من مكتبات» ومحفوظات. ومتاحف مقرها الولايات المتحدة. 
يوروبيانا هي بوابة إلكترونية ومجمّع للبيانات الوصفية لأكثر من مئة وثلاثين من 
المكتبات والمتاحف وال مكتبات الرقمية للوسائط المتعددة في جميع أنحاء أوروبا. 
محفوظات بيانات ا مجلس الأوروبي للعلوم الاجتماعية (CESSDA)‏ هي 
بوابة إلكترونية ومجمع للبيانات الوصفية منذ ما يزيد عن ثلاث وعشرين سنة 
ممستودعات البيانات الأوروبية الإحصائية للعلوم الاجتماعية التي تضم ASÍ‏ من 
ثمانية وعشرين ألف من مجموعات البيانات. 


Data Holding حاوية البيانات‎ 


(أرشيف البيانات) Data‏ 


Archive 


الكتالوجات. al‏ البوابات» 
البيانات الوصفية» وال مجمُعون 
Catalogues , Directories‏ 


, Portals , Metadata , 


Aggregators 
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خدمات أرشفة وشبكات البيانات (DANS)‏ هو الأرشيف الوطني الهولندي 
لبيانات البحوث الرقمية. إضافة للأرشفة: وتقدم المبادئ التوجيهية للتدريب 
والاعتماد. 


أرشيف بيانات المملكة المتحدة (UKDA)‏ هو مستودع بيانات الموقع الواحد 
لبيانات بحوث العلوم الاجتماعية والإنسانية الممولة من قبل مجلس البحوث 
الاقتصادية والاجتماعية (ESRC)‏ ولجنة نظم المعلومات المشتركة (JISC)‏ 
وجامعة إسيكس Essex)‏ 


المستودع الرقمي الآيرلندي (DRI)‏ هو مستودع رقمي موثوق للبيانات 
ا معاصرة والتاريخية» الاجتماعية والثقافية» وتقوم عليه المؤسسات الأيرلندية, 
ويوفر إتاحة الوصولء والحفاظ على البيانات للجهات المعنية ذات المصلحة 
واكتشافها. 


أوبونير (Openaire)‏ هو مستودع رقمي متعدد المواقع للحصول على البيانات 
العلمية المفتوحة في منطقة البحث الأوروبية 35$ d‏ من واحد وأربعين منظمة 
وثلاثة وثلاثين بلدا أوروبيا. 


المكتبة الرقمية لتكساس (TDL)‏ هي مجموعة من مؤسسات التعليم العالي 
التي توفر منصة وخدمات مشتركة لتوفير الوصول المفتوح للبيانات والحفاظ 


توفر البنية التحتية للبيانات الجغرافية المكانية الكندية (CGDI)‏ 
الوصول الموخد. والمتسقء والدقيقء والقابل للتشغيل المتبادل للبيانات 
المكانية عبر القطاعات والنطاقات الكندية. 


الفصل الثاني 


مستودعات بيانات الموقع 
الواحد 


Single-site Repositories 


مستودعات بيانات متعددة 
امواقع 


Multi-site Repositories 


البنى التحتية السيبرانية 


Cyber- Infrasrtuctures 





المصدر : مقتبس بتصرف من -O'Carroll et a!.(2013)‏ 
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(Y-Y) جدول‎ 


مجموعة منتقاة من مؤسسات تقديم المشورة» والضغط لكسب التأييد» والتنسيق للمحافظة على 
البيانات وإتاحتها للوصول والمشاركة وإعادة الاستخدام في العلوم الاجتماعية والإنسانية 


The Federation of All European www.allea.org اتحاد جميع الأكادميات‎ 
(Academies (ALLEA الأوروبية‎ 


British and Irish Sound Archives www.bisa-web.org ا محفوظات الصوتية‎ 
(BISA البريطانية والايرلندية‎ 


Consortium of European Social Science www.cessda.org الاتحاد الأو رو لمحفوظات‎ 
Data Archives البيانات للعلوم الاجتماعية‎ 


(Coalition for Networked Information (CNI www.cni.org التحالف من أجل معلومات‎ 


مترابطة 


Common Language Resources and www.clarin.eu موارد اللغة المشتركة والبنية‎ 
(Technology Infrastructure (CLARIN التحتية التقنية‎ 


Committee on Data for Science and www.codata.org لجنة البيانات للعلوم‎ 
Technology of the International والتقنية للمجلس الدولى‎ 
Council for Science للعلوم‎ 


Digital Services Infrastructure for Social www.dasish.eu الخدمات الرقمية للبنية التحتية‎ 
(Sciences and Humanities (DASISH للعلوم الاجتماعية والإنسانية‎ 


WWW. 


(Digital Production Partnership (DPP الشراكة للإنتاج الرقمي‎ 
digitalproductionpartnership. 


co.uk 
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International Federation of Television www.fiatifta.org الاتحاد الدولي لمحفوظات‎ 
(Archives (FIAT/IFTA التلفزيون‎ 


International Association for Social www.iassistdata.org الرابطة الدولية لخدمات‎ 
Science Information Services and امعلومات والتكنولوجيا‎ 
(Technology (IASSIST للعلوم الاجتماعية‎ 


International Association of Sound and www.iasa-web.org الرابطة الدولية‎ 
Audiovisual Archives للمحفوظات الصوتية‎ 
والسمعية - البصرية‎ 


Inter-university Consortium for www.icpsr.umich.eda/ اتحاد الجامعات للبحوث‎ 


(Political and Social Research (ICPSR icpsrweb/ICPSR السياسية والاجتماعية‎ 


Network of Expertise in Long-term www.langzeitarchivierung.de/ | التخزين‎ à شبكة الخبرة‎ 
(Storage of Digital Resources (NESTOR | /Subsites/nestor/DE/Home | على المدى الطويل للموارد‎ 


الرقمية 


Open Planets Foundation www.openplanetsfoundation. | مؤسسة الكواكب ال مفتوحة‎ 


org 


المصدر : مقتبس بتصرف من 2013( -(O'Carroll et al.‏ 





الأسس المنطقية للبنى التحتية للبيانات البحثية: 

بالنظر إلى أن بناء البنى التحتية للبيانات هي ممارسة ليست باليسيرة» ومكلفة من حيث 
الموارد والوقت الذي يستلزمه إنشاؤها والمحافظة عليها بشكل مستمرء فينبغي أن تكون 
هناك أسباب معتبرة لإجراء مثل هذا المسعى والمضي فيه. ويستعرض الجدول (Y-£)‏ قائمة 
لأكثر من ثلاثين من هذه الأسباب مقسمة على ثلاثة أبعاد - مباشرة / وغير مباشرةء وفي Sabl‏ 
القريب / وعلى ال مدى «JI‏ والعامة / والخاصة بحسب تعريف )2010( .Beagrie et al.‏ 
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os‏ أن تترجم هذه الأسباب تقريبياً إلى المكاسب العلمية والمالية» والتأثير التراكمي للفوائد. 
والمستفيدين من هذه البنى التحتية. 

وتتمحور المناقشات والحجج العلمية لتخزين» ومشاركة» وتوسيع البيانات داخل البنى 
التحتية للبيانات حول وعود من الاكتشافات والابتكارات الجديدة من خلال الجمع بين 
مجموعات البيانات والتوظيف الجماعي للعقول المشاركة. فمجموعات البيانات الفردية 
ذات قيمة في حدّ ذاتهاء ولكن عند ضمّها جنباً إلى جنب مع مجموعات بيانات أخرى 
أو تفحضّها بطرق وأساليب جديدة: فإن رؤى وأفكار جديدة من المحتمل أن تظهر 
وأسئلة جديدة من ال ممكن أن تتم الإجابة عليها )2007 (Borgman‏ فبسبب الطبيعة 
التراكمية» من خلال الجمع بين مجموعات البيانات» يمكن الزعم بتسارع وتيرة بناء المعرفة 
.(Lauriault et al. 2007)‏ وعلاوة على ذلك» يصبح من الممكن من خلال الحفاظ على 
البيانات تتبع الاتجاهات والأنماط مع مرور الوقتء وكلما ازدادت فترة التسجيل للبيانات» 
زادت معها القدرة على بناء النماذج وأنظمة المحاكاة ومن ثم زيادة الثقة في الاستنتاجات 
التي يتم التوصل إليها )2007 .(Lauriault et al.‏ لذاء فإنه ومع مرور الوقت» تزداد 
القيمة التراكمية مستودعات البيانات والبنى التحتية بحيث تصبح البيانات متاحة على 
نطاق واسع وبشكل أكثر يسر وذلك من حيث النطاق والصلاحية الزمانية. 


ومن ال مرجح أن تعمل هذه ال مشاركة الاستراتيجية إلى بث روح التعاون بين الباحثين والفرق 
في التخصصات الجديدةء وتعزيز المهارات بصورة أكبر من خلال إمكانية الوصول إلى نواع 
جديدة من البيانات )2007  .(Borgman‏ وعلاوة على US‏ فإن تبادل ا معلومات واعتماد 
معايير وبروتوكولات وسياسات البنية التحتية من شأنه أن يرفع من مستوى جودة البيانات 
وأن يفسح المجال لأطراف أخرى لإنتاج بيانات مُشتقة والتحقق من البيانات اممتاحة» ومن 
ثم زيادة سلامة البيانات )2007 (Lauriault et al.‏ كما تعمل البنى التحتية أيضاً على 
إتاحة بيانات عالية الجودة في التعليم وتحسين المصادر التربوية والتعليمية لتدريب الجيل 
القادم من الباحثين. كما أن البنى التحتية للبيانات هي الوسيلة الوحيدة لإدارة البيانات 
وا مشاريع بكفاءة وفعالية في الحالات التي تعتمد فيها المشاريع العلمية بشكل كبير على 
أدوات تقنية المعلومات والاتصالات الباهظة الثمنء والتي ينتج عنها كميات هائلة من 
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البيانات» وكذلك في المشاريع التي تضم فرقاً بأعداد كبيرة من الباحثين المنتشرين في جميع 
أنحاء العام لتحليل هذه البيانات: لذا فإن البنى التحتية للبيانات تمثل الوسيلة الوحيدة 
الفاعلة والفعالة لإدارة مثل هذه النوعية من البيانات والمشاريع )2007 (Borgman‏ 


وتتمحور الفوائد المالية للبنى التحتية للبيانات حول الموازيين الاقتصادية التي L3‏ 
من خلال تقاسم الموارد ومشاركتها وتجنب تكرارهاء والآثار المترتبة على إعادة الاستخدام 
للبيانات اللمكلفة:. والثروة الناتجة من خلال الاكتشافات الجديدة. وإنتاج مجتمعات 
أكثر كفاءة. فالبحث عملية مكلفة في العادة. حيث تنفق وكالات التمويل المختلفة 
بشكل جماعي مليارات الدولارات سنوياً لتمويل النشاط البحثي» وينطوي جزء كبير من 
هذا النشاط على ازدواجية غير ضرورية في جهود إنتاج البيانات. ومعالجتهاء وإدارتهاء 
وتحليلها. وبدلاً من إنشاء عدد كبير من المحفوظات الأرشيفية الخاصةء فإنه من المنطقي 
إنشاء عدد أقل من البنى التحتية المخصصة التي تقوم بتقديم وتحضير البيانات الأساسية 
على صورة Bass‏ وتنتج فعالية كبيرة في الجهد. وتمكن كذلك وصولاً أوسع للبيانات 
للأفراد الباحثين والمؤسسات كون تكاليف الدخول إلى حقل أو مجال بحثي في العادة 
باهظة )2008 .(Fry et al.‏ وإضافة إلى ذلك» ستصبح عمليات ونتائج المشاريع البحثية 
أكثر شفافية ويمكن الحكم على مدى تمثيلها القيمة مقابل المال. وفضلاً عن Jodl‏ من 
الهدر والحفاظ على الثمار الناتجة من هذه الجهود وتقاسمهاء فإنها ستعمل على تعظيم 
العائد من الاستثمار من خلال تمكين xS]‏ قدر من المكاسب التي هكن الحصول عليها من 
البيانات )2007 .(Lauriault et al.‏ فعلى سبيل «JULI‏ قد ينتج عن إتاحة البيانات على 
نطاق واسع صناعات جديدة قائمة على المعرفة وتكون شركات منبثقة ومنفصلة من خلال 
تسويق البحوث ال ممولة من القطاع العام (ائتلاف العلوم 2013 Science Coalition‏ 
كما هكن للبيانات ضمن البنى التحتية للبيانات أن تؤدي إلى طرق أكثر فعالية في الحوكمة 
والإدارة المجتمعية. على سبيل «JULI‏ توفر العديد من البنى التحتية للبيانات المكانية 
«dab gl‏ إضافة إلى دعمها للبحوث المكانيةء أدوات فعالة للإدارة والحكومة الإقليمية, 
وتمكن من الاستعداد للطوارئ والاستجابة للكوارث بصورة أكثر فعالية. وتسهيل التخطيط 
بين الدول. 
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وبحسب ما تم إيضاحه من خلال النقاش حتى «OI‏ فإن الفوائد المحتملة المكتسبة 
من البنى التحتية للبيانات هي فوائد ممتدة وغير محصورة بالقطاع العام أو الخاص 
.(Beagrie etal. 2010)‏ وقد ظهر جليا في الواقع أن استراتيجية مشاركة البيانات 
وتقاسمها تعود بالفائدة على جميع الأطراف - الباحثين» المؤسسات» امممولين» والمؤسسات 
العامة والخاصة. فعلى مدى العقدين الماضيينء وبالنظر إلى المكاسب المتوقعة من مشاركة 
البيانات وتبادلهاء عملت الوكالات البحثية للحكومات الوطنية والهيئات الإقليمية مثل 
الاتحاد الأوروبي» جنباً إلى جنب مع المنظمات الخيرية» على الاستثمار بنطاق واسع في Jas‏ 
مجموعة كبيرة من المبادرات المختلفة. ومع ذلك» وكما هو مبين أدناهء فهناك مقاومة ممثل 
هده المشاريع» وعلى الأخص من قبل الباحثين أنفسهم» ومن الواضح أنه على الرغم من 
أن هناك فوائد لا شك فيهاء فهناك أيضا تكاليف مرتبطة بإنشاء البنى التحتية للبيانات. 


تحديات بناء البنى التحتية للبيانات: 
على الرغم من الفوائد المتوقعة والمُدركة من البنى التحتية للبيانات. إلا أنها م تلق 
ترحيبا عالمياء كما أنها أثبتت صعوبة بنائها وتنفيذهاء فهناك مجموعتين رئيسيتين من 
القضايا الفاعلة - التقنية والاجتماعية/ السياسية - التي تعوق تطوير البنى التحتية للبيانات 
وتنميتهاء وستواصل القيام بذلك لبعض الوقت. 
جدول رقم )۲-٤(‏ 


فوائد مستودعات البيانات والبنى التحتية للبيانات 


الفوائد المباشرة الفوائد غير المباشرة (تجنب التكاليف) 


التواصل العلمي / إتاحة الوصول إلى البيانات. عدم فقدان لفرص البحث المستقبلية. 


إعادة تحديد الأهداف وإعادة استخدام البيانات. | انخفاض تكاليف المحافظة على البيانات في المستقبل. 


زيادة الإنتاجية البحثية إعادة توظيف البيانات للمهتمين الجدد. 
تحفيز أنواع جديدة من التواصل / التعاون. إعادة توظيف المنهجيات المستخدمة. 


إتاحة البيانات للتعليم ومشاريع الطلاب. الاستخدام من قبل مهتمين جدد. 
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ساي اال عل امار ليك 


تحسين قاعدة المهارات. الأدوات وال معايير يحتمل أن تزيد من مستوى جودة 
البيانات. 


زيادة الإنتاجية / النمو الاقتصادي. تقليل الاستفسارات العشوائية المتعلقة بالبيانات 


التث - من البحث / فاده JI‏ 3 


او 


قيمة للباحث والطلاب الحاليين. تأمين القيمة للباحثين والطلاب المستقبليين. 


عدم فقدان البيانات بتغير الباحثين. إضافة القيمة مع مرور الوقت ونمو المجموعة 
وتطورها للحد الأقصى. 

توسيع إتاحة الوصول حيث التكاليف الباهظة | زيادة سرعة البحث والوقت اللازم لإدراك آثاره. 

للباحثين / المؤسسات. 


إعادة الاستخدام على المدى القصير للبيانات المنسقة | يحفز الأسئلة البحثية الجديدة: وبخاصة المتعلقة 
í‏ بالبيانات المرتبطة والمشتقة. 


تعزيز توافر البيانات للنشر واطمشاركة. 


الفوائد الخاصة الفوائد العامة 


فوائد للرعاة / ا ممولين من البحث / المحفوظات. 


فوائد للباحثين والمؤسسات. تحفيز البحوث الجديدة. 
الوفاء بالالتزامات الخاصة gb‏ تحفيز الشركات الجديدة وتوظيف اطهارات العالية. 


زيادة الوضوح / الاقتباس. الشفافية في تمويل البحوث. 


— كك 


.Beagrie et al. 2010; Fry et al 2008 ال مصدر:‎ 
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dale des Loos انات لبس‎ det! dosis وقايلة‎ dole D 5 eta إن‎ 

إذا كان النظام موثوقاً ويقدم مستويات مختلفة من إتاحة الوصول اعتماداً على تعريف 

المستخدم وضمانات فيما يتعلق بمصدر البيانات وسلامتهاء ونزاهتهاء وصلاحيتهاء فذلك 

يتطلب تعاوناً ics‏ وواسع النطاق والموائمة بين منتجي البيانات ومالك المحفوظات 
الأرشيفية فيما يتعلق بالتالي: 


٠‏ إجراءات إنتاج البيانات. 

٠‏ نماذج البيانات ومعايير البيانات. 

« البيانات الوصفية والتوثيق. 

o‏ إجراءات تحضير وتنقية وإدخال البيانات. 

o‏ جودة البيانات وضمانها. 

e‏ سياسيات الحفاظ على البيانات» والنسخ الاحتياطي» والتدقيق عليها. 
o‏ البرمجيات وال معدات. 

٠‏ أمن وحماية المعلومات. 


o‏ سياسات الوصولء ومنح التراخيص»› والاستخدام, وإعادة الاستخدام, والخصوصية»› 
والجوانب الأخلاقية. 


o‏ سياسة الملكية. وحقوق الطبع والنشر» وحقوق الملكية الفكرية. 
٠‏ الترتيبات الإدارية وآليات تنظيم الإدارة والحوكمة. 
٠‏ تمويل البنية التحتية وخدماتها وإدارتها. 
(Borgmann 2007; Data Seal of Approval 2010; O'Carroll and Webb 2012)‏ 
فالبنية التحتية للبيانات لن تنجح إلا ]15 كان لديها رؤية ibob‏ الأجلء وهناك ell‏ 
لإدارة المحتوى نيابة عن المودعين والمستخدمين وتحمل مسؤوليتهاء مع التطبيق التام 
لجميع العوامل المذكورة أعلاه بشكل فعال )2012 (O'Carroll and Webb‏ 
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فالقضايا التي تمت الإشارة إليها ليست مجرد قضايا تقنية, ولكنها أيضاً اجتماعية وسياسية, 
ذلك لأنها تتطلب التفاوض والاتفاق على طريقة تصميمها واختيارها ومتطلبات إدارتها 
القائمة بين العديد من الأطراف - ال ممولينء وال مصممينء والمبدعينء والمديرين وا مودعين» 
ومجموعات الضغط والتوجيه» والمساهمين وأصحاب المصالح الخاصة الأخرى - في سياق 
مختلف التعليمات, واللوائح» والقوانين المتعلقة بإنتاج» وتخزين» ومشاركة البيانات. ومن 
ثم» فهي تتشكل بواسطة الأجندات الشخصية والشخصيات. والقيم المؤسسية, والالتزامات 
والوصايات. والثقافات» والهياكلء والعمليات» والتمويلء والقضايا الحكومية» والتبعيات 
الإجرائية حيث أنه بمجرد أن يبدأ المشروع في مسار معينء فسيكون من الصعب UU‏ توجيهه 
في مسار مختلف .(Feenberg in Lauriault 2012; Lauriault et al. 2007) a ze us‏ 
كما يمكن أن يكون تجميع ومواءمة ا محفوظات الأرشيفية المعتمدة على مسارات تقنية 
مختلفة عملية في d‏ الصعوبة» وطويلة الأمد. ومكلفة لأنها تتطلب من تلك المشاريع 
إجراء تغييرات لتحديث بياناتها المتقادمة لتتوافق مع ال مواصفات المتفق عليها ف اموائمة 
liag .(Lauriault 2012)‏ هو السبب في اعتماد العديد من اللمشاريع الأرشيفية على بنية 
مستودع البيانات بدلا من السعي لتصبح بنية تحتية إلكترونية/ سيبرانية. 

Los‏ بعد الصعوبات المتعلقة بإنشاء هياكل تبادل البيانات» إقناع أصحاب البيانات 
أنفسهم بتبادل سلعتهم الثمينة (بياناتهم)» فهناك مبدأ أساسي في البحوث الأكادهية وهو 
إتاحة الوصول المفتوح؛ «uie‏ أن جميع جوانب إنتاج المعرفة ينبغي أن تكون متاحة بحرية 
للآخرين لتفحصها ونقدها. وهذا المبدأ م يُعمل به على النحو الأمثل أبد إذ تختفي الأبحاث 
الأكادمية في الغالب خلف حواجز الأجور ويتردد الباحثون في مشاركة بياناتهم وتبدلها مع 
الآخرين. وكما أشار )2007( Borgman‏ فإن مشاركة البيانات وتبادلها شائع في عدد قليل 
من التخصصات مثل علم الفلك (Astronomy)‏ علم الجينات (Genomics)‏ وعلم البيانات 
العمرانية بهيئتها الرقمية (Geomatics)‏ والتي تعتمد على فرق علمية كبيرة وموزعة جغرافيا؛ 
Ul‏ في التخصصات الأخرى فيجري في أحيان نادرة مشاركة البيانات وقد لا تجري على الإطلاق. 
وقد خلصت Borgman‏ إلى أن «السرٌ الصغير القذر» وراء تشجيع مشاركة البيانات» وتبادلها 
هو عدم التبادل لكثير من البيانات في الواقع )1059 :2012 .(Borgman‏ وذلك لأن هناك 
Ioas‏ من المثبطات التي تحول دون تبادل البيانات ومنها: 
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٠‏ الجهد اللازم لإعداد وأرشفة البيانات. 
o‏ نقص الخبرة واطوارد والأدوات اللازمة لأرشفة البيانات. 
o‏ مخاوف من القدرة على استخراج قيمة من البيانات قبل الغير» وذلك من حيث الأوراق 
العلمية وبراءات الاختراع» ونظرا للجهد المستثمر في إنتاج البيانات. 
« المخاوف بشأن الكيفية التي سيتم بها استخدام البيانات» خاصة إذا كانت تتعلق 
بأشخاص» أو كيف ممكن أن يساء التعامل معها أو يساء تفسيرها. 
٠‏ المخاوف بشأن الاستفسارات بخصوص إنتاج البيانات والطلبات التي من شأنها أن 
تستلزم أعمالا إضافية. 
٠‏ مخاوف من القضايا المتعلقة بالكشف عن البيانات ونتائج البحوث التي هكن تقويضها 
من خلال تفسيرات بديلة لنفس البيانات. 
o‏ قضايا الملكية الفكرية. 
e‏ الخوف أنه لن يتم استخدام البيانات» وبالتالي تشكل الأرشفة جهداً ضائعا. 
Borgman 2007, 2012; Strasser 2013)‏ (. 
فمن الواضح أن ضمان البيانات من خلال أرشفتها لإعادة T SN‏ مقا سوق 
يتطلب أكثر من محرد إنشاء مستودعات البيانات olg‏ التحتية dy‏ كون ذلك يتطلب 
EEE‏ في الممارسات البحثية. ويتكشف هذا التغيير للعيان باستخدام إستراتيجية 
العصا والجزرة. فمن ناحية بدأ استخدام الحوافز لتشجيع الباحثين على أيداع وتبادل 
البيانات» مثل تشجيع الاقتباس والإسناد عند إعادة استخدام البيانات )2012 (Borgman‏ 
وتوفير الأموال الكافية لأرشفة البيانات ضمن جوائز المنح. ومن ناحية qs]‏ بدأت وكالات 
الأبحاث في إجبار الباحثين على إيداع وتبادل البيانات» مع مراعاة الجوانب الأخلاقية وحقوق 
املكية الفكرية» كشرط لتمويل البحوث. 
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وسطاء البيانات والأسواق :(Data Brokers and Markets)‏ 
يمتلك القطاع الخاص دافعاً مختلفاً جداً لإنتاج وإعادة استخدام البيانات عن ذلك الذي 
عند الأكاديميينء فالبنى التحتية للبيانات البحثية تسعى لتحقيق الصالح العام من خلال 
إنشاء مشاعات للبيانات لتسهيل وتشجيع تبادل البيانات وإعادة استخدامها. وف المقابلء 
يلتقط وسطاء البيانات (يسمون أحياناً مجمعي أو مختزلي أو بائعي البيانات) البيانات 
ويجمعونها معاً ويعيدون تعبئتها (تحزهها) في البنى التحتية للبيانات التي يملكها القطاع 
الخاص لعرضها للإيجار (للاستخدام öh‏ واحدة أو لاستخدامها تحت شروط الترخيص) 
أو إعادة البيع على أسس ربحية. وتشمل المنتجات قوائم العملاء/الزبائن ال محتملين 
الذين يستوفون معايير معينة Le)‏ في ذلك تفاصيل مثل الأسماء. العناوين» أرقام الهاتف. 
وعناوين البريد الإلكتروني» وكذلك معلومات مثل «الجنسء العمرء العرق» وجود الأطفالء 
الدخلء قيمة ال منزل: ملكية بطاقة GLY‏ الوضع الائتماني» أنماط الشراء والهوايات»؛ 
(CIPPIC 2006: ii)‏ والتدقيق على الخلفية الأمنية. ومجموعة من منتجات البيانات 
المشتقة التي أضاف لها الوسطاء قيمة من خلال التكاملء ومنتجات تحليل البيانات 
التي تستخدم في معظم الأحوال لحملات الدعاية والتسويق المصغرةء وتقييم الجدارة 
الائتمانية والتصنيف الاجتماعي للأفرادء وتوفير خدمات البحث عن المفقودينء وتقديم 
تحليلات الأعمال ال مفصّلة )2006 .(CIPPIC‏ وفي حالة القوائم» فهي في معظمها مستأجرة 
s‏ كثير من الحالات لا يستلم المستأجر ÀE‏ حيث يعمل مكتب خدمة كطرف ثالث 
على إعداد وإرسال البريد بالنيابة «Jibbs .(CIPPIC 2006) eae‏ مع تحليلات البيانات» 

حيث يتلقى العملاء نتائج تحليل البيانات» وليس ذات البيانات الأساسية. 

إن عمليات اختزال البيانات وإعادة بيعهاء وما يرتبط بها من تحليل للبيانات وخدمات 
ذات قيمة مضافة, هي صناعة بمليارات الدولارات» مع كميات هائلة من البيانات وا معلومات 
المستمدة التي تؤجرء وتباع» وتشتري بشكل يومي عبر مجموعة متنوعة من الأسواق - تجارة 
2l‏ 355« والمالية» والصحة. والسياحة» والخدمات اللوجستية» والأعمال الذكيةء والعقارات» 
والأمن الخاصء» والاقتراع السياسيء وإلى آخره. وتتعلق هذه البيانات بجميع جوانب الحياة 
اليومية وتشمل الإدارة العامة والاتصالات» واستهلاك السلع ووسائل الإعلامء والسفرء 
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dlg‏ والجريمة. وتفاعلات وسائل التواصل الاجتماعيةء وإلى آخره. فوس طاء البيانات 
ا متخصصين هم متواجدون منذ فترة طويلةء يجمعون البيانات من اشتراكات وسائل الإعلام 
(على سبيل JELI‏ الصحف. والمجلات)» وتجار التجزئة عبر طلبات البريدء واستطلاعات الرأي 
والدراسات الاستقصائية. ووكالات السفرء والمؤتمرات. وا مسابقات. وتسجيلات وضمانات 
المنتجات» وشركات معالجة الدفع والسدادء والسجلات الحكومية:. وإلى آخره CIPPIC)‏ 
2006(. وفي السنوات الأخيرة وخاصة منذ ظهور الإنترنت» توسعت هذه الصناعة بشكل 
سريع» مع التنوع في البيانات التي تم التقاطها واختزالهاء وا منتجات والخدمات التي تقدمهاء 
وغاليا ما تممع معا de e‏ سواء البيائات الضغية والكبيرة. 

فبيع البيانات للوسطاء أصبح ثل تدفقا مهما للدخل للعديد من الشركات؛ فعلى سبيل 
المثالء يبيع تجار التجزئة» في كثير من الأحيانء البيانات المتعلقة بالعمليات مثل تفاصيل 
بطاقة الائتمان» ومشتريات العملاء وبرامج الولاء الخاصة با متجرء وإدارة علاقات العملاء 
ومعلومات الاشتراك. كما تبيع المواقع الإلكترونية بيانات النقر (الاختيارات) المتعلقة 
بكيفية تصفح شخص ما gigh‏ على شبكة الإنترنت والوقت الذي يقضيه على مختلف 
الصفحات. وبالمثل تستخلص شركات وسائط الإعلام» مثل محطات الصحف والإذاعة 
والتلفزيونء البيانات الواردة في محتواها (على سبيل JUL‏ الأخبارء والإعلانات). وتستخلص 
شركات وسائط التواصل الاجتماعي البيانات الوصفية وبيانات المحتوى لمستخدميهاء 
وتستخدم هذه البيانات لتحديد المواصفات الأساسية للمستخدمين ومنتجات البيانات 
الخاصة بهم» أو بيع البيانات لوسطاء البيانات. على سبيل JULI‏ تستخدم شركة فيسبوك 
ا ملفات التعريفية للمليارات من مستخدميهاء وشبكاتهم الاجتماعية. وا محتوى الذي 
يقومون بتحميله (المفضلات,. والتعليقات» والصورء والفيديوهات,. وما إلى ذلك) لتمكين 
مجموعة من المنتجات الإعلانية مثل الإعلانات الموجهة للجماهير المتماثلة Lookalike)‏ 
«(Audiences‏ والجماهير المخصصة المدارة (Managed Custom Audiences)‏ وفئات 
الشريك (Partner Categories)‏ وذلك بالشراكة مع وسطاء البيانات الكبيرة والمسوقين 
blo Jis‏ لوجيكس «Datalogix)‏ وأبسيلون (Epsilon)‏ وأكسيوم (Acxiom)‏ وبلو كاي 
(BlueKai)‏ من أجل دمج بيانات الشراء الخاصة بهم التي لا تخص فيسبوك مع البيانات 
السلوكية التي يوفرها الفيسبوك )2013 (Edwards‏ 
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فبطرق مختلفة» يتخلى الأفراد عن البيانات الشخصية الخاصة qp‏ عن قصد أوعن غير 
La‏ وبدرجات متفاوتة: بصفة مشترينء أو مشتركين» أو مسجلين» أو أعضاء أو حاملي 
«Ua;‏ أو مانحین» أو متسابقين: أو مشاركين في الاستطلاعات» أو حتى مجرد مستفسرين 
.(CIPPIC 2006: ii)‏ وعلاوة على ذلك» وحيث إن إنشاء وإدارةء وتحليل البيانات هي 
مهمة متخصصة» تستعين العديد من الشركات بجهات خارجية من شركات معالجة البيانات 
وتحليلاتها للوفاء بمتطلبات البيانات الخاصة بها. وتستطيع هذه الشركات. من خلال 
تقديم هذا النوع من خدمات البيانات ممختلف العملاء slu‏ مجموعات بيانات واسعة 
النطاق» والتي يمكن الجمع بينها وحزمها لاستخدامها في إنتاج بيانات مشتقة جديدة» والتي 
بدورها توفر المزيد من الأفكار والرؤى مقارنة بتلك التي يمكن تحصيلها من مصدر واحد 
فقط للبيانات» وإضافة إلى هذه البيانات التي يحصل عليها وسطاء البيانات من القطاع 
الخاص» يعمل هؤلاء الوسطاء كذلك على الحصول على مجاميع بيانات القطاع العام سواء 
التي تتعلق بالأفراد أو تلك التي تخص مجموعة منهم كفئة معينة وأماكنهم مثل بيانات 
سجلات الملكية والتعداد السكاني» كما يقومون باستئجار/ أو شراء القوائم المتعلقة بالأفراد 
من الجمعيات الخيرية وا منظمات غير الحكومية. 

ومن خلال تجميع البيانات من مصادر متنوعةء يُنشئ وسطاء البيانات بنية تحتية من 
البيانات الضخمة واطترابطة. فعلى سبيل «JULI‏ تشتهر شركة إبسيلون (Epsilon)‏ بامتلاك 
بيانات عن ثلائمائة مليون بطاقة ولاء من أعضائها في جميع أنحاء blo‏ إضافة إلى بنك 
معلومات يضم بيانات ذات صلة مئتين وخمسين مليون مستهلك في الولايات المتحدة 
وحدها )2013 (Edwards‏ كما تشتهر شركة أكسيوم (Acxiom)‏ بإنشائها بنكا للمعلومات 
يتعلق بخمسمائة مليون مستهلك JES‏ في جميع أنحاء العام (تقريباً مئة وتسعون مليون 
شخص. ومئة وستة وعشرون مليون أسرة في الولايات المتحدة). مع نحو ألف وخمسمائة 
معلومة عن كل شخص,» وتنفذ خوادمها أكثر من خمسين تريليون عملية في السنةء وتجاوز 
إجمالي تدوير رأس امال للشركة المليار دولار (Singer 2012a)‏ كما كدير bas‏ قواعد 
بيانات منفصلة» أو تعمل مع سبعة وأربعين شركة من كبرى الشركات اممئة الأكبر في العام 
.(Singer 2012a)‏ وتزعم شركة داتا لوجيكس (Datalogix)‏ بتخزينها بيانات متعلقة 
مشتريات b‏ تتم عن طريق الإنترنت تبلغ قيمتها أكثر من تريليون دولار )2013 (Edwards‏ 
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وتشمل شركات الوساطة والتحليل للبيانات شركات أخرى مثل شركة ألايانس داتا سيستمز 
«(Alliance Data Systems)‏ وإي بيرو (eBureau)‏ وتشويس بوينت (ChoicePoint)‏ 
وكورلوجيك (Equifax) 4535.55]  (Corelogic)‏ وإكسبيريان (Experian)‏ آي دي 
أنالاتكس (ID Analytics)‏ وإنفوجروب (Infogroup)‏ وإننوفيس (Innovis)‏ وإنتليوس 
(Intelius)‏ وريكورديد فيوتشر (Recorded Future)‏ وسيسنت 3l 39 (Seisint)‏ يونيون 
.(TransUnion)‏ وتتجه كل شركة من هذه الشركات إلى التخصص في أنواع مختلفة من 
البيانات ومنتجات البيانات والخدمات» فعلى سبيل JULI‏ تقيم شركة إي بيرو العملاء 
المحتملين بالنيابة عن شركات بطاقات الائتمان» والمقرضينء وشركات التأمين» والمؤسسات 
التعليميةء كما تقدم شركة إنتليوس خدمات البحث عن الأشخاص والتحري عن خلفياتهم 
(Singer 2012a)‏ 


وبشكل «ele‏ فإن مبتغى وسطء البيانات وشركات التحليل هو مجموعة واسعة من 
البيانات (الصغيرة والكبيرة): والمتعلقة بأكبر شريحة ممكنة من السكان» وأن تكون هذه 
البيانات مترابطة بشكل كبير ويمكن تمييزها (تحوي تعريف فريد) بحسب طبيعتهاء وكلما 
obla] Jas ag ps ul‏ تير ومح التويد من البباتات كان عمال متععانه EE‏ 
وعلى النحو الأمثلء واكتسب ميزة تنافسية عن منافسيه الآخرين. ويمكن من خلال جمع 
البيانات معا وهيكلتها بشكل مناسب لوسطاء البيانات اشتقاق بيانات جديدةء وملفات 
تعريفية عن الأفراد وال مناطق» والقيام بإجراء النمذجة التنبؤية لتوقع ما قد يفعله الأفراد 
في ظل ظروف مختلفة وفي أماكن مختلفة. وهذا من شأنه أن يمكن من تحديد المستهدفين 
والمخاطر بشكل أكثر فاعلية بين مختلف المستهلكين وأن يُعطي مؤشراً على مدى التصرف 
ا محتمل لهؤلاء المستهدفين والدفع بهم لاختيار استجابة معينة (على سبيل JELI‏ اختيار 
وشراء عنصر معين)» فشركة أكسيوم تسعيء على سبيل JULI‏ لربط البيانات غير المتوافرة 
على الإنترنت «(Offline Data)‏ والبيانات المتوافرة على الإنترنت «(Online Data)‏ وحتى 
البيانات المتنقلة (Mobile Data)‏ من أجل تكوين نظرة شاملة متعددة الزوايا عن 
المستهلكينء حيث تستخدم هذه البيانات لإنشاء ملفات تعريفية مفصلة وتماذج تنبؤية 
متماسكة (Singer 2012a)‏ فهذه المعلومات والنماذج مفيدة جدا لشركات الشراء لأنها 
تمكنهم من تركيز جهودهم المتعلقة بالتسويق واممبيعات» وتزيد من فرص نجاح عملياتهم» 
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في ذات الوقت الذي تمكنهم من dadl‏ من النفقات من حيث الهدر والخسارة التي قد تنتج 
عن استثمارات محفوفة با مخاطرء ومن ثم تسعى هذه الشركات لتصبح أكثر فعالية وكفاءة 
في عملياتها باستخدامها Jib‏ هذه المنتجات. 

ومن امثير للاهتمام» أنه بالرغم من امتلاك وسطاء البيانات وشركات التحليل لكميات 
كبيرة ومتنوعة من البيانات الشخصية التي تستخدم منتجاتها لتصنيف واستهداف الأفراد 
والأسر اجتماعياء فقد كان هناك نقص ملحوظ في الدفع بالاهتمام النقدي لعمليات هذه 
الشركات. ففي الواقح» هنالك ندرة في التحليل الأكادممي والإعلامي عن هذه الشركات 
والآثار المترتبة على عملها ومنتجاتهاء ويعود السبب في ذلك جزئياً إلى أن هذه الصناعة 
بعيدة عن الأضواء وسرية dead‏ ولا ترغب في توجيه انتباه الجمهور إليهاء وزعزعة ثقة 
الجمهور في أصولها وأنشصطتهاء والتي قد تؤدي إلى حملات dele‏ للشفافيةء والمساءلة 
والتنظيم. فوسطء البيانات بشكل عام غير منظمين إلى do‏ كبير في الوقت الحاضرء كما 
أنهم غير ملزمين قانونياً بتزويد الأفراد بإمكانية الوصول إلى البيانات ا محفوظة عنهم ولا 
هم ملزمون بتصحيح الأخطاء المتعلقة بهؤلاء الأفراد .(Singer 2012b)‏ وإضافة إلى أن 
بيانات ومنتجات هذه الشركات يمكن أن يكون لها تأثير عميق في الخدمات والفرص اللقدمة 
للأفراد. مثل ما إذا كان سيتم تقديم عرض لفرصة «Jas‏ أو قبول تقديم طلب قرضء أو 
إصدار بوليصة تأمينء أو الموافقة على الاستئجارء وتكلفة السلع والخدمات المقدّرة على 
أساس ال مخاطر المتوقعة والقيمة بالنسبة لشركة ما )2002 (Lyon‏ 

إن قلق البعضء من فيهم 2013( (Edith Ramirez‏ رئيسة لجنة التجارة الاتحادية 
(Federal Trade Commission)‏ في الولايات المتحدة, يتمثل في ممارسة هذه الشركات 
شكلاً من أشكال حتمية البيانات (Data Determinism)‏ التي لا يجري فيها فقط تصنيف 
الأفراد والحكم عليهم على أساس ما فعلوه» ولكن على التنبؤ Le‏ قد يفعلونه في المستقبل 
باستخدام خوارزميات هي أبعد ما تكون عن الصحة والكمال» بحيث قد تحمل في ثناياها 
تحيزات تتعلق ASY «3, sJb‏ والجنسء والحياة الجنسية. وحتى الآن» فهم صناديق 
سوداء تفتقر إلى الرقابة المجدية والإجراءات المعالجة. وتستخدم بيانات منخفضة الجودة 
على الأغلب» ومن ثم تكون عرضة للخطأ (انظر أيضاً للفصل العاشر). وعلاوة على ذلك 
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فإن هذه الشركات تستخدم البيانات لغير الأغراض التي E‏ إنشاؤها لأجلهاء وبالتأكيد 
ليست لأغراض أولئك الذين تشير البيانات إليهم وتمثل ما قد يرغبون فيهء فالذين يتقدمون 
ببياناتهم للحصول على بطاقة ولاء المتجر لا يتوقعون بالضرورة أن يتم بيع بياناتهم 
واستخدامها لأغراض تتجاوز علاقتهم مع ال متجرء ولا يتوقعون استخدامها بطرق قد تعرضهم 
للعقاب والمحاسبة بعد ذلك )2013 .(Ramirez‏ وبينما يرحب بعض المستهلكين بالعروض 
الشخصية من المتاجر أو الإعلانات daz Sl‏ على المواقع الإلكترونيةء يعدها البعض الآخر 
تطفلا واستغلالية (20122 (Singer‏ وعلاوة على ذلك. فإن كنز البيانات التي قد يكون 
لها قيمة في المستقبل كإجراء للمضاربة السوقية: هو انتهاك لقوانين 32JI‏ من البيانات التي 
تنص على وجوب الإبقاء على البيانات محددة القيمة فقط )2013 .(Raley‏ ويعد وسطاء 
eu.‏ هذفا رتخا abso 28 us Lie M c e ae‏ ولك ااك إل 
حجم السجلات الشخصية الحساسة مثل الأسماء. والعناوين» وأرقام الهوية (مثل الضمان 
الاجتماعي» وجواز السفرء ورخصة القيادة). وأرقام بطاقات الائتمان المتوافرة لديهم. وف 
الواقع» فقد تابعت لجنة التجارة الاتحادية (Federal Trade Commission- FTC)‏ أكثر 
من أربعين قضية لخروقات أمنية خطيرة OLLU‏ أغلبها ضد وسطاء البيانات» لفشلهم في 
توفير ضمانات أمنية كافية على البيانات )2013 (Ramirez‏ 

وف الآونة الأخيرة» وفي أعقاب الخروقات الأمنية والكشف عن صفقات بيع مشبوهة 
واستخدام لبيانات حساسة )2013 Ue (Dwoskin‏ إلى جنب مع الكشف عن برنامج 
بريزم التجسسي لوكالة الأمن القومي (NSA PRISM)‏ ووصول الحكومة إلى سجلات تجارية 
(Greenwald and MacAskill 2013)‏ إضافة للأخبار عن فضيحة قرصنة الهاتف العالمي 
واستجواب ليفينسون (Leveson)‏ في المملكة المتحدة http://www.levesoninquiry.)‏ 
(org.uk‏ فقد ao 51 Lual‏ من الاهتمام على وسطاء البيانات وممارساتهم التجارية. ففي 
أواخر عام 2012 استدعت لجنة التجارة الاتحادية تسعة من وسطاء البيانات لاكتشاف 
ا مزيد حول ماهية البيانات والمعلومات الممستمدة منها التي يقومون بإنتاجها وجمعها عن 
الناس وكيفية توظيفهم هذه البيانات وطرق بيعهاء وأصدرت تقريراً يدعو للخصوصية 
عند التصميم (انظر الفصل العاشر). وخيارات مبسطة. وقدر أكبر من الشفافية (لجنة 
التجارة الاتحادية 2012 (Federal Trade Commission‏ وعلاوة على US‏ فقد تم 
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الفصل الثاني 


تطبيق الضغط السياسي لاعتماد أنظمة Laj‏ رقابة وأكثر شفافية. أما في أوروباء فيسعى 
قانون الاتحاد الأوروبي الجديد لحماية البيانات لتنظيم كيفية استخدام البيانات» ومنح 
المواطنين الحق في الوصول إلى البيانات والتنازع عليها والحق في تناسيها وحذفها (انظر 
الفصل العاشر). وسيعتمد مدى نجاح مثل هذه الأعمال على إعادة تشكيل أعمال وسطاء 
البيانات والذي سيحدثنا عنه الزمن لاحقاء وفي غضون ذلكء هناك العديد من الأسئلة 
المتعلقة بوسطاء البيانات والأسواق وآثارها على المواطنين والمستهلكين التي تحتاج إلى 
استكشاف للإجابة عنها (انظر الفصل السادس). 


الخلاصة: 

على الرغم من الدعوات المنمقة لمؤيدي البيانات الكبيرة وأولويات التمويل للوكالات 
البعقيسة: قان OTI‏ المشيرة aida‏ مالاك Liar Date alab‏ في فضاء البحث 
العلميء فدراسات البيانات الصغيرة قد تكون محدودة في الحجم» ومحصورة من حيث 
عيناتها وتنوعهاء وثابتة» وغير مرنة بمجرد تنفيذهاء ولكنها خدمت العلوم بشكل جيد حتى 
وقتنا الحاضر لأنها مصممة خصيصا للرد على أسئلة مركزة بإحكام. ويتيح إنتاج البيانات 
الصغيرةء جنبا إلى جنب» مع أدوات التحليل الجيدة, للباحثين التنقيب الدقيق وبشكل Jlsà‏ 
في مستويات محكمة من البيانات العالية الجودة من أجل فهم العام. «Jail às‏ وكما 
نوقش في الفصل الثامن» تسعى العديد من دراسات البيانات الكبيرة إلى الإجابة عن الأسئلة 
التي يمكن الإجابة عنها من البيانات المنتجة؛ فكما قيل: الذيل الآن هو الذي يهز الكلب. 

ومع ذلك» فمن الواضح أن رؤى وقيمة أكبر بكثير يمكن الحصول عليها من البيانات 
الصغيرة من خلال توسيع نطاقها في البنى التحتية للبيانات والاحتفاظ بها للأجيال القادمة. 
وفي حين أن البيانات ولفترات طويلة قد جُمعت معاء وجرى تخزينها وأرشفتهاء إلا أن 
تطور التقنيات الرقمية قد غير بشكل جذري قدرتنا على إدارةء وتنظيم» ومعالجةء وتحليلء 
ومشاركة» وإعادة استخدام البيانات» وخاصة تلك البيانات التي ولدت رقمية في الأصلء 
فقد كانت البيانات الصغيرة فيما سبق نادرة ومقيّدةء ولكنها غدت متوافرة بشكل أكبر 
وأكثر انفتاحاً (انظر الفصل الثالث). وبتوسيع نطاق هذه البيانات هكن تحقيق جدوى 
اقتصادية وذلك فيما يتعلق بخدمات البيانات» وأدوات التحليل واموارد التربويةء وتوظيف 
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البيانات الصغيرة. والبنى التحتية للبيانات» ووسطاء البيانات 


البيانات في استخدامات جديدة: وإنتاج اكتشافات جديدة. ونتيجة UU‏ يُبذل الآن جهد 
كبير لإنتاج البنى التحتية للبيانات في جميع المجالات الأكادهية. وهو الجهد الذي من شأنه 
أن eus‏ بشكل أكبر بكثير البيانات للمجتمعات المعنية وأن so‏ طبيعة عمل العلوم (انظر 
الفصل الثامن). 

ويتضح ا مدى الذي يمكن من خلاله لهذا التوسع إنتاج قيمة من خلال النمو السريع 
لقطاعي وساطة البيانات والتحليلات المصاحبة لها. حيث هكن لوسطاء البيانات» من خلال 
الجمع بين مخازن كبيرة من البيانات الصغيرة التي تحتفظ بها المؤسسات العامة والشركات 
الخاصة ودمجها جنباً إلى جنب مع مجالات تدفق البيانات الكبيرة, إنتاج مختلف أنواع 
ا ملفات التعريفية التفصيلية للأفراد وا مجموعات والتي يمكن استخدامها للاستهداف المركز 
للأسواق» وتقييمهاء وفرزهاء مما يوفر معلومات ذات قيمة عالية للعملاء. كما تكشف هذه 
ا ممارسات عن بعض القضايا وا مخاطر الناجمة عن التوسع في نطاق البيانات» وبالتحديد 
استخدامها لغير الأغراض التي جمعت لأجلهاء وأمنهاء والفرص الجنائية في حال تم سرقة 
البيانات» حيث م يفهم أي من هذه القضايا والمخاطر بشكل تام حتى OYI‏ مع ضعف 
الجانب التنظيمي والإجراءات المضادة. 

فهناك العشرات من الأُسئلة التي تتطلب اهتماماً بشأن الدور المستقبلي وطبيعة 
دراسات البيانات الصغيرةء وتوسيع نطاق البيانات الصغيرة إلى أشكال مختلفة من البنى 
التحتية للبيانات والآثار المترتبة عليهاء والعواقب الناتجة عن حفظ البيانات والوساطة 
فيها على أساس الربح. ومع ذلكء فمن الواضح أن التحليل النقدي للتغيرات التي تحدث 
ليست مواكبة للتطورات التقنية والتجاريةء فالواقع أنه حتى الآن كان هناك عدد قليل من 
الانطباعات النقدية المبنية على أساس التفكير من خلال الآليات والدلالات في كيفية إنتاج 
البيانات الصغيرةء وتوسيع نطاقها واستخدامهاء والتنظير لأدواتها - قواعد البيانات والبنى 
التحتية للبيانات - التي يتم استخدامها لتنظيم وتبادل وتحليل البيانات. ونتيجة لذلكء 
هناك ندرة في المعرفة المتعلقة بالأنظمة الاجتماعية التقنية الناشئة والمعقدة التي يتم 
إنشاؤهاء مع عدد قليل من دراسات الحالة المعمقة. ومن ثم» يتضح أن هناك حاجة للكثير 
من البحث والتأمل لفهم البنى التحتية للبيانات في جميع أشكالها. 
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€ 


الفصل الثالث 
البيانات المفتوحة (Open Data)‏ والبيانات المرتبطة (Linked Data)‏ 


بالنظر إلى التكاليف والنفقات واموارد المطلوبة لإنتاج مجموعات البيانات وقيمتها في 
الكشف عن معلومات عن العام من حولناء فقد تم بشكل عام تقييد الوصول إليها بطريقة 
أو بأخرى» فعلى سبيل eco JEL‏ الوصول للمستخدمين المسجلين المعتمدين فقط أو من 
خلال المطالبة برسوم اشتراك» أو عن طريق حصر الكيفية التي يمكن فيها استخدام البيانات 
بواسطة السياسات والتراخيص. وحتى عندما كانت مجموعات البيانات متاحة ومفتوحة 
تا ف dU A‏ هة PERTE doas ls and]‏ 
الحاسب. والبرمجيات» والمهارات المتعلقة بطرق الإحصاء ورسم الخرائط وا معرفة السياقية 
للحقل أو الموضوع الذي يجري التطرق إليهء مما يتعذى بكثير قدرات عموم الناس. ونتيجة 
لذلك» كانت البيانات وا معلومات المستمدة منها تقليديا مغلقة إلى d>‏ كبير بطبيعتها - أي 
مقفل عليها داخل مؤسسة أو محفوظ أرشيفي. وف الواقع» فقد Jio‏ عدم إتاحة الوصول 
إلى مجموعات البيانات التي يمكن أن تساعد في الإجابة عن أسئلة معينة مصدر إحباط على 
مدى قرون للباحثين» وا محللين. والصحفيين» ومنظمات المجتمع المدني. 

٠‏ ومن هذا المنطلق سعت حركة البيانات المفتوحة لتحويل هذا الوضع جذريًاء ليس 
فقط من خلال فتح البيانات وإتاحتها لإعادة استخدامها على نطاق أوسع فقطء ولكن Laj‏ 
من خلال توفير أدوات بحثية سهلة الاستخدام والتي لا تتطلب الحاجة إلى مهارات تحليلية 
متخصصة. وبنيت هذه الحركة على ثلاثة مبادئ هي: الانفتاح» والمشاركة: والتعاون 
(البيت الأبيض 2009 (White House‏ فمن خلال الشفافية: وا مشاركةء والعمل معاً هكن 
إدراك قيمة البيانات للمجتمع. وتهدف الحركة إلى تحرير القدرة على إنتاج المعلومات 
واللغرقة بدلا من pas‏ إمكانية الاستفادة من 858 البيانات على منتتحيها أو أولكك الذين 
يمكنهم دفع ثمن إتاحة الوصول إلى البيانات. وقد تركز الاهتمام» على وجه الخصوص, على 
فتح البيانات التي 3 إنتاجها من قبل أجهزة الدولة وغالبا ما يطلق عليها معلومات القطاع 
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الفصل الثالث 


العام (Public Sector Information - PSI)‏ أو البحوث الممولة من القطاع العام (انظر 
الفصل (CUI‏ مع الأخذ بالحسبان Ob‏ هذه البحوث قد تم تمويلها من قبل الخزينة العامة 
لفائدة عامة الناس» مع تركيز أقل على فتح البيانات التي تم إنشاؤها من قبل القطاع 
الخاصء والتي قد يكون لديها قيمة خاصة أكبر عند منتجيها على وجه الخصوص. 

وقد تطورت حركة البيانات المفتوحة خلال العقدين الماضيينء بالتزامن مع - ولكن مع 
فصل واضح إلى i>‏ كبير عن - حركة الحق في المعلومات (Right to Information-RTI)‏ 
dsl‏ باتخاذ قرارات الشفافية وصنع الساساف مع قيل الوكالات وللشروقة اقا باسم 
حرية المعلومات (Freedom of Information)‏ وحركتي المصدر المفتوح والعلوم المفتوحة 
امعنيتين بإعادة تشكيل البرمجيات والنشر إلى أشكال مفتوحة وشفافة فيما يتعلق بالترخيص» 
وحقوق الطبع والنشرء وحقوق الملكية الفكرية. فمنذ آواخر سنة 2000م» اكتسبت حركة 
البيانات ال مفتوحة مكانة بارزة وزخم ثابت بشكل ملحوظ ابتداء من حملة صحيفة 
الغارديان في المملكة المتحدة تحت مسمى" تخليص بياناتنا- Free Our Data" (www.‏ 
(theguardian.com/technology/free-ourdata‏ ودعوة منظمة التعاون الاقتصادي 
والتنمية (Organization for Economic Cooperation and Development - OECD)‏ 
حكومات الدول الأعضاء لفتح بياناتها في عام 2008 «e‏ وإطلاق الحكومة الأمريكية في العام 
9 للموقع الإلكتروني (www.data.gov)‏ وهو موقع على شبكة الإنترنت صَمّم لتوفير 
الوصول إلى مجموعات البيانات غير الحساسة والتاريخية التي تحتفظ بها أجهزة الدولة 
على مستوى الولايات ومستوى الحكومة الفيدرالية بالولايات المتحدة الأمريكيةء وتطوير 
البيانات المرتبطة والترويج ل الويب (Semantic Web) JYI‏ كعنصر موحد لتكنولوجيا 
الانترنت في المستقبلء والذي يمكن البيانات المفتوحة والبيانات ال مرتبطة من أن تتصل في 
الغالب بشكل طردي )2009 .(Berners-Lee‏ ومنذ عام 2010 «e‏ حذت حذوها عشرات 
الدول والمنظمات الدولية على سبيل «JUL‏ دول الاتحاد الأوروبي European Union-)‏ 
(EU‏ وبرنامج الأمم المتحدة الإماني United Nations Development Programme-)‏ 
(UNDP‏ مما حعل الكلاف من معموعات eL‏ اللقيدة ماقا (gtl igra dea‏ 
للاستخدام غير التجاري والتجاري (انظر 2013 (DataRemixed‏ .489 أسهم في مثل هذا 
التحوّل في الموقف مجموعات الضغط الدولية والوطنية المؤثرة مثل مؤسسة المعرفة المفتوحة 
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البيانات المفتوحة والبيانات المرتبطة 


«(Sunlight Foundation) ومؤسسة ضوء الشمس‎ (Open Knowledge Foundation) 
ورافقه ضغط من المجموعات والشركات العاملة في مجال الاقتصاد المعرفيء بالإضافة إلى‎ 
كبار موظفي الخدمة المدنية المقتنعين بالحجج المستخدمة: وعشرات الجماعات المحلية التي‎ 
ASA تسعى للاستفادة من البيانات‎ 

وي حين يتم عرض حجج حركة البيانات المفتوحة بطريقة بديهيةء باستخدام مفردات 
الاستعارة البلاغية مثل الشفافية» والمساءلة» والمشاركة. والابتكارء والنمو الاقتصادي, فإن 
الانفتاح السريع للبيانات الحكومية والعلمية م يلق تيبا غاا فالواقع, أن العديد 
من الآثار الاجتماعية والسياسية والاقتصادية لفتح البيانات يجري حاليا الكشف عنها 
ومناقشتها وانتقادها. وعلاوة على US‏ وللمفارقة إلى do X o‏ تعزز نطاق ومدة حقوق 
الملكية الفكرية على مدى نصف القرن الماضيء بمعنى أن نمو حركة البيانات المفتوحة تم 
بالتوازي مع زيادة في حقوق الملكية الفكرية )2006 «(Pollock‏ فالمقاومة التي واجهتها 
فكرة توفير حرية الوصول إلى البيانات العلمية نوقشت في الفصل السابقء وسيتم في القسم 
الأخير من هذا الفصل مناقشة الانتقادات الموجهة لدعوى البيانات المفتوحة. فبداية. ومع 
ذلكء يحدّد هذا الفصل خصائص البيانات المفتوحة والبيانات المرتبطة.» ومختلف الطرق 
التي هيأت لقضية البيانات dir sil‏ والاقتصاديات المرتبطة بتقديم بيانات مفتوحةء وعلى 
الرغم من أن فتح النبانات الحكومية aye Ulo ls‏ فليس غتالك كنك los Nose di à‏ 
يحدث بشأن الكيفية التي تتم من خلالها عرض ومشاركة البيانات بشكل عام. 


البيانات المفتوحة :(Open Data)‏ 
عند أحد المستويات. يُعد تعريف مصطلح البيانات المفتوحة بسيط نسبياء فقد حدّده 
بولوك (2006) على سبيل المثال كالتالي: «تكون البيانات مفتوحة إذا كان لأي شخص الحرية 
في استخدامهاء وإعادة استخدامهاء وإعادة نشرها - فقط شرط موافقتها متطلب إسنادها 
و/ أو مشاركتها على حذ سواء». ولكن هذا التعريف يلمح إلى الطبيعة المتنوعة ما يمكن 
أن يكون عليه المقصود من لفظة «الفتح» وكيف أنها يمكن أن تعني أشياء مختلفة بالنسبة 
cà‏ الوكالات في سياق حقوق الملكية الفكرية, فقد يشير الانفتاح إلى الاستخدام 
أو إعادة الاستخدام» أو إعادة الصياغة» أو إعادة التوزيع» أو إعادة النشر والتوزيع» أو 
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الفصل الثالث 


إعادة البيع» وقد يكون لكل منها شروط وأحكام تختص بهاء فعلى سبيل المثال قد يكون 
للمستخدم القدرة على استخدام مجموعة البيانات بحرية موجب ترخيص. ولكن ذلك لا 
يعني إمكانية إعادة التعامل مع هذه البيانات بهدف الربح التجاري أو إعادة البيع» أو 
أي استخدام قد يتطلب الإسناد. وبعبارة ]49,2 قد يكون الوصول إلى مجموعة البيانات 
مفتوحاء ولكن ليس بالضرورة أن يكون كل ما يمكن فعله مع البيانات الممكن الوصول إليها 
مفتوح أيضا. وفي حالات أخرى» قد تحتفظ المنظمات ببياناتها وتتحكم بإتاحة الوصول 
إليها بنفسهاء ولكنها تتيح بحرية البيانات الوصفية المتعلقة بها فقط أو قد تسمح اللنظمة 
لبعض المستخدمين بالوصول إلى البيانات» ولكنها لا تمكنهم من إعادة نشرها إلا إذا كان ذلك 
سيحقق قيمة مضافة لها وبدون الوصول إلى البيانات الأولية الأساسية. 

ومع ذلك» سعت عدد من المنظمات إلى تحديد الخصائص امثالية للبيانات المفتوحة» 
على سبيل JELI‏ يؤكد تعريف الانفتاح ob‏ العمل هو مفتوح إذا استوفت حالته في النشر 
الشروط المنصوص عليها في الجدول رقم (Y-Y)‏ والتي تفرض بعض القيود على الوصول, 
والاستخدام, وإعادة الصياغة, وإعادة التوزيع والنشرء وتشجع كذلك بشكل نشط على 
الاستخدام الربحي للبيانات المفتوحة دون أي تعويض مالي لمنشئ البيانات الأصلي. وبا مثلء 
cose‏ منظمة الحوكمة المفتوحة (OpenGovData)‏ تسعة مبادئ للبيانات المفتوحة 
تتعدى مجرد نمط التوزيع إلى النظر أيضاً في طبيعة البيانات نفسها (انظر الجدول رقم 
3-2(. وبالإضافة إلى هاتين المجموعتين من الشروط / المبادئ» اقترحت وكالات أخرى Jio‏ 
منظمة التعاون الاقتصادي والتنمية )2008( (OECD)‏ والحكومة الأسترالية Fitzgerald)‏ 
0) حاجة البيانات المفتوحة إلى أن تكون مصحوبة بقوائم الأصول وآليات اكتشاف 
البيانات» من أجل إصدار المؤشرات المتعلقة بجودة البيانات وموثوقيتهاء واستخدام النماذج 
والمعايهر التي تتيح قابلية التشغيل البيني للبيانات ال مفتوحة. وتوفير بنى تحتية سهلة 
الاستخدام للبيانات لتسهيل النشر المنتظم وإيجاد مجموعات بيانات جديدة: بالإضافة 
إلى عدد من الأدوات الأساسية والتخصصية التي من شأنها أن تحسن الاستخدام والتحليل 
للبيانات. ويُعد ضمان التشغيل البيني مهما بشكل خاص لأنه يسمح بربط مجموعات 
البيانات ا مختلفةء مما يُسهم في بناء مجموعات بيانات جديدة ASÍ‏ تعقيدا واكتشاف رؤى 
جديدة (مؤسسة امعرفة المفتوحة 2012 .(Open Knowledge Foundation‏ كما لا توجد 
قيود فيما يتعلق بمجالات التركيز للبيانات ا مفتوحة - حيث يمكن أن تتعلق بأي مجال 
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من المجالات الاجتماعية. والاقتصادية. والتجارية» والثقافية (وسائل الإعلام وال مكتبات 
والتراث)» والبيئية» أو الظواهر العلمية - ولكن» بشكل «ele‏ ينصب التركيز حتى الآن على 
فتح البيانات التي تتصل بالسياسات العامة عالية المستوى ولها قيمة تجارية عند إعادة 
استخدام مثل البيانات المتعلقة بالاقتصادء والنقلء والبيانات الجغرافية. 
جدول رقم (F-V)‏ 
الخصائص اللثالية للبيانات المفتوحة المتعلقة بتعريف الانفتاح 
إتاحة الوصول Access‏ | ينبغي أن يكون العمل متاحاً بمجموعه ككل وبلا تكلفة إعادة 


إنتاج تتجاوز المعقول كما ينبغي أن تتوفر بشكل مناسب قابل 
للتعديل 


إعادة التوزيع ينبغي أن لا تقيّد الرخصة أي طرف عن بيع العمل أو 
Redistribution‏ توزيعه سواء فيما يتعلق بالعمل نفسه أو كان ذلك العمل 
كجزء من حزمة مركبة من أعمال من عدّة مصادر مختلفة. 

وينبغي أن لا يتطلب الترخيص إتاوة أو رسوماً أخرى لهذا 


البيع أو التوزيع. 


إعادة الاستخدام Reuse‏ ينبغي أن يسمح الترخيص بالتعديل على العمل وإجراء عمليات 


الاشتقاق منه ويسمح كذلك بتوزيع الأعمال المشتقة وفقاً لأحكام 
العمل الأصلي. 


غياب القيود التقنية Absence‏ | ينبغي تقديم العمل على الصورة التي لا يوجد معها عقبات 
of technological restrictions‏ | تقنية تحول دون استخدامه أو إعادة توزيعه. 


الإسناد Attribution‏ قد يلزم الترخيص الإسناد إلى الممساهمين والمبدعين للعمل 
الأصلي كشرط لإعادة التوزيع وإعادة الاستخدام» وإذا تم فرض 
هذا الشرط فينبغي ألا تتطلب عملية الإسناد إجراءات مرهقة 
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من الممكن أن يشترط الترخيص حمل الإصدارات المعدّلة للبيانات 
أسماء تختلف عن العمل الأصلي كشرط لإعادة توزيعها. 


ينبغي عدم تمييز الترخيص ضد أي شخص أو مجموعة من 
الأشخاص وضمان إتاحة الوصول للجميع. 


ينبغي عدم تقييد أي شخص من الاستفادة من العمل في أي مجال 
معين. على سبيل اطثالء لا ينبغي تقييد العمل من استخدامه في 
الأعمال التجارية. 


ينبغي تطبيق الحقوق المتعلقة بالعمل على جميع الذين يتم 
إعادة توزيعه عليهم دون الحاجة لتنفيذ ترخيص إضافي من قبل 
تلك الأطراف. 


ينبغي أن لا تعتمد الحقوق المتعلقة بالعمل على كونه جزءاً من 
حزمة معينة. 


بغي أن لا يضع الترخيص قيوداً على الأعمال الأخرى التي يتم 
توزيعها جنباً إلى جنب مع العمل المرخص. على سبيل JOM‏ 
ينبغي أن لا يضر الترخيص على أن تكون كل الأعمال المستمدة 


الفصل الثالث 


الصحة والنزاهة Integrity‏ 


عدم التمييز ضد الأشخاص أو 
No discrimination against‏ 


persons or groups 


No discrimination العمل‎ à 


against fields of endeavor 


توزيع الترخيص Distribution‏ 


of licence 


Licence must not be أعمال‎ 


specific to a package 


ciesa عدم‎ 
Licence must الأعمال الأخرى‎ 
not restrict the distribution 


of other works 





المصدر: مقتبس من .http://opendefinition.org/od‏ 
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البيانات المفتوحة والبيانات المرتبطة 


جدول رقم (Y-Y)‏ 
مبادئ منظمة الحوكمة ال مفتوحة للبيانات ال مفتوحة 


يجب أن تكون البيانات كاملة تكون كافة البيانات متاحة» مع مراعاة أحكام وشروط 


Data must be complete‏ الخصوصية» والأمن أو قيود الصلاحيات. 


يجب أن تكون البيانات أساسية (أولية) | تنشر البيانات كما تم جمعها من المصدن مع أفضل 
مستوى ممكن من التفاصيل» وليست بأشكال مجملة أو 


Data must be primary 


يجب أن تكون البيانات في الوقت إتاحة البيانات في أسرع وقت ممكن عند الحاجة لها 
المناسب للحفاظ على قيمة البيانات. 
Data must be timely‏ 
يجب أن تكون البيانات في المتناول | إتاحة البيانات لأكبر عدد ممكن من المستخدمين ولأوسع 


Data must be accessible‏ جموعة من الاغراض. 


يجب أن تكون البيانات قابلة للمعالجة | تنظم البيانات بشكل مناسب للسماح بالمعالجة الآلية لها 
àJVyl‏ 


Data must be machine- 
processable 
يجب عدم تمييز عملية الوصول تتوفر البيانات لأي أحد. مع عدم اشتراط التسجيل.‎ 


Access must عط‎ non- 


discriminatory 


يجب أن 0353 صيغ البيانات غير | 393 البيانات في صيغة لا يكون فيها سيطرة حصرية 


Data formats must be non- 


proprietary 
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الفصل الثالث 


يجب أن يكون ترخيص البيانات مجانياً | لا تخضع البيانات لأية أحكام في حقوق التأليف والنشر 

وبراءات الاختراع والعلامات التجارية. وقد qua)‏ ببعض 

قيود الخصوصية والأمن والصلاحيات المناسبة بحسب ما 
تفرضه التشريعات الأخرى. 


Data must be licence-free 


يجب أن يكون الامتثال قابلاً للمراجعة | يجب أن يتم تعيين شخص كضابط اتصال للرد على الناس 
وإعادة النظر الذين يحاولون استخدام البيانات أو تقديم شكاوى حول 
انتهاكات المبادئ الرئيسية. ويجب أن يكون هناك هيئة 
أخرى ذات اختصاص لتحديد ما إذا تم تطبيق المبادئ 
شكل متاسب: 


Compliance must be reviewable 





امصدر: مقتبس من http://www.opengovdata.org‏ 


do ولبست خدمة.‎ dais المانات اللفنوحة‎ ALI كن تعد هذه الخصاتص‎ le ls 
حول الحاجة إلى إعادة التفكير بالبيانات اممفتوحة‎ Gurstein (2013) المقابلء» فقد جادل‎ 
بوصفها تفاعلاً وتنطوي على علاقة بين مزودي البيانات‎ - (Service process) كعملية خدمية‎ 
والمستخدم النهائي. فبالنسبة له لا يكفي أن تكون البيانات ببساطة متاحة من قبل المنظمات‎ 
مع الأخذ بعين‎ daad لإعادة استخدامهاء بل ينبغي أن يكون فتح البيانات موجّها أكثر باعتباره‎ 
الاعتبار حاجات وتوقعات المستخدمين النهائيين منهاء فهذه الإعادة لصياغة المفاهيم تقترح‎ 
طرق مخغلفة لإدارة البياقات وابلب عد مين‎ gll igt الببانات‎ aao الذين‎ elis] ue 
«4 النهائيينء كالآثار المترتبة على قضايا إعادة تحديد المصدر الخاص بالبيانات. فبالنسبة‎ 
يتطلب هذا النوع من النهج مشاركة المستخدمين النهائيين في التخطيط والتطويرء وإدارة‎ 
المشاريع الجارية للبيانات المفتوحة, وكذلك استخدام مقاييس لتقييم مدى نجاح مثل هذه‎ 
المشاريع في تعزيز الصالح العام وهذا يتطلب برامج بناء القدرات الرامية إلى رفع مهارات‎ 
المستخدمين ليكونوا قادرين على إدارة ومعالجة وتحليل البيانات بشكل مناسب وفعال.‎ 
ورغم أنه من السهل أن نتفق على أنه ينبغي تسليم البيانات المفتوحة كخدمة. إلا أن‎ 
أو تنتج القليل مقابل تمويل هذه الترتيبات الخدمية‎ Is البيانات ا مفتوحة بطبيعتها لا تنتج‎ 
فضلاً عن التكاليف المتعلقة بفتح البيانات» فالواقع أن ذلك قد يكون من الطموح إلا إذا تم‎ 
تطوير نماذج تمويل فعالة (كما نوقش أكثر بالكامل أدناه).‎ 
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البيانات المرتبطة :(Linked Data)‏ 
ias‏ فكرة البيانات المرتبطة بتحويل شبكة الانترنت من شبكة الوثائق إلى شبكة البيانات 
من خلال إنشاء الشبكة الدلالية )2010 «(Semantic web) (Berners-Lee 2009; P. Miller,‏ 
أو ما اصطلح عليه 2010( (Goddard and Byrne‏ مصطلح «المقروءة Ul‏ على شبكة الإنترنت» 
.(Machine-Readable Web)‏ وتدرك هذه النظرة بأن كافة المعلومات التي يتم تبادلها 
على الإنترنت تحتوي على تنوع غني للبيانات - أسماء وعناويز: «qid anos‏ ا 
والأرقام, إلى آخره. ومع ذلك» لا يتم بالضرورة تحديد هذه البيانات (rum‏ على هذا gal‏ 
كما أنها ليست منتظمة رسمياً في طريقة يمكن معها جمعها واستخدامها بسهولة, فالواقع» أن 
معظم وثائق شبكة الإنترنت غير منظمة إلى 3o‏ كبير في طبيعتها. ومن خلال ترميز الوثائق 
وهيكلتها باستخدام معرفات فريدة واستخدام لغة التوصيف OS «(Markup Language)‏ 
جحل البيانات القن تحفويها هذه الوثائق dida‏ وكين الكقرين VIS‏ من دمجها ومالجتها 

وفهمهاء وربطها مع البيانات الأخرى ذات الصلة )2010 (P. Miller,‏ 

ومن أجل تمكين شبكة الإنترنت الدلالية من أن تعمل كبيانات مرتبطة, > بين Berners-‏ 
Lee (2009)‏ حاجة الوثائق المنشورة على شبكة الإنترنت للمواءمة مع أربعة توقعات 
سلوكية. EN‏ يجب تعريف الكائنات والموارد ضمن كل وثيقة باستخدام لغة التوصيف 
الموسعة (XML- Extensible Markup Language)‏ وتسميتها بشكل واضح لا لبس فيه 
باستخدام معرفات اموارد الموحدة t (Uniform Resource Identifiers -URIs)‏ 
ينبغي استخدام الهيكل الضمني لشبكة الإنترنت لربط الوثائق والمعلومات (على سبيل 
«JULI‏ استخدام معيار نقل النصوص التشعبية - اتش في في بي (HTTP)‏ ومعرفات الموارد 
الموحدة (URIs)‏ بحيث هكن التنقيب في الأسماء والبحث فيها). ثالثاء تسهيل اكتشاف 
المعلومات حول كائن مس می أو مورد (على سبيل «JUL‏ عندما يقوم شخص بالبحث عن 
معرّف لكائن pii da‏ له معلومات مفيدة باستخدام معايير إطار عمل وصف اللوارد 
.(Resource Description Framework -RDF)‏ فإطار عمل وصف »jlgll‏ هو وثيقة 
تفصّل وتصف طبيعة معرّفات الموارد ضمن نطاق ما وينبغي أن يُحال كل معرّف إلى 
هذه الوثيقة لتحصيل معلوماته )2010 (Goddard and Byrne‏ ويضمن استخدام 
هذه ال معايير إطاراً مشتركاً لجمع البيانات عبر الإنترنت» jus‏ من اعتماد مجموعة كبيرة من 
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الأساليب المتعارضة )2012 (Dietrich‏ رابعلا توفير وصلات Jas JU‏ بين الكاثتات واطوارة 


وتمكن هذه التوقعات السلوكية من جعل الوثائق مقروءة آلياً ويمكن معالجتها بحيث 
يكون التعرف على طبيعة الكائنات فيها ممكناً (على سبيل JEL‏ الولايات المتحدة هي «Ab‏ 
وباراك أوباما هو شخص)» وإزالة الغموض عن المفاهيم (على سبيل «JUL‏ مارس هو قطعة 
شوكولاتة» والمريخ (مارس) هو كوكب؛ أو أن باراك أوباما هو مؤلف وثيقة مقابل أن باراك 
أوباما هو موضوع وثيقة). وإنشاء روابط وعلاقات داخل البيانات (على سبيل JEL‏ باراك 
أوباما هو رئيس الولايات المتحدة) )2010 (Goddard and Byrne‏ وبهذه الطريقة, 
يصبح من الممكن لوثائق شبكة الإنترنت أن تكون قابلة للقراءة UT‏ بحيث لا يقتصر عمل 
برنامج القراءة على فهم المحتوى ولكن هكنه أن يستمد أيضاً بيانات مشتقة جديدة من 
خلال الاستدلال من المحتوى )2010 .(Goddard and Byrne‏ 

ladies‏ تنشر الوثائق بهذه الطريقةء هكن استخلاص المعلومات على شبكة الإنترنت 
وإعادة تقدهها كبيانات وربطها بطرق لا حصر لها اعتماداً على الغرض. ولكن» وبحسب 
ما دوّن )2010( P. Miller‏ فإن «البيانات المرتبطة مكن أن تكون بيانات مفتوحة؛ ويمكن 
ربط البيانات المفتوحة, ولكن من الممكن أيضاً للبيانات المرتبطة أن تحمل تراخيصاً أو 
غيرها من القيود التي تحول دون اعتبارها مفتوحة». أو إتاحة البيانات المفتوحة بطرق قد 
لا تجعل من السهل ربط بعضها ببعض. وبشكل «ele‏ فإن أي وثائق مرتبطة ليست متوافرة 
على شبكة الإنترنت أو تقع ضمن نطاق نظام اشتراك مدفوع هي أيضا بيانات مفتوحة 
بطبيعتها. فبحسب ما يرى )2009( Berners-Lee‏ ينبغي أن تكون البيانات المفتوحة 
والبيانات المرتبطة متكافئة بشكل «Its‏ وإضافة لذلك فقد حدد خمسة مستويات Jib‏ 
هذه البيانات» كل منها أكثر فائدة وقيمة تدريجيا (انظر الجدول رقم 3-3). وكان تطلعه 
إلى ما أسماه بيانات الخمسة نجوم (المستوى الخامس) - شبكة دلالية عاملة بالكامل. 
ولكن تجدر الإشارة إلى أنه بالنسبة إلى العديد من المنظمات. فإن مجرد الحصول على 
مستويات أعلى من المستوى الأول d‏ إنجازاً وكون المستوى الخامس بعيد المنال عنها دون 
عمالة ماهرةء وموارد إضافيةء وأدوات جديدة. 
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(Y-Y) الجدول‎ 


المستويات الخمسة للبيانات المفتوحة والبيانات المرتبطة 


Lee [cmm [ men [n 


يتم قفل البيانات à‏ 
الوثيقة ويصعب تحريرها 
ley‏ 
تعتمد على برامج حصرية 
للوصول إليها واستخدامها. 


هل البيانات على الشبكة, 
ليست البيانات على 
الشبكة. وليست مرتبطة 
بطبيعتهاء ومن ثم هي 
معزولة. 
يمكن أن تزيد زمن تحضير 
البيانات وإدارة البيانات 
وتبادلها. 


للحفاظ على الروابط 
الداخلة والخارجة. 


البيانات متوافرة. 


يمكن تحليل البيانات 


باستخدام البرمجيات الحصرية 


/ الاحتكارية؛ كما يمكن 

تصديرها إلى صيغ أخرى. 
يمكن تحليل البيانات 
باستخدام أية حزمة 


برمجية. 


يمكن الوصول إلى البيانات 
من أي مكان على شبكة 
الإنترنت» ومن السهل ربطها 
جنبا إلى جنب مع غيرها من 
البيانات» وإمكانية وصلها 
بالأدوات والمكتبات القانئمة. 
كما في المستوى «obl‏ 
ولكن تصبح البيانات أكثر 
اكتشافاً | وتمنج المستخدمين 
وصولاً كاملاً إلى مخطط 
(أنطولوجيا) البيانات 


مقروءة آلياً ولكن بصيغة 
حصرية (على سبيل JEU‏ 
ملف إكسل). 


čo باستخدام‎ Ui مقروءة‎ 


(على سبيل JULI‏ صيغة سي 
إس في- (CSV‏ 


مقروءة آلياً باستخدام صيغ 
عامة غير حصرية واستخدام 
ا معرفات ووصف الموارد 
(URIs and RDF)‏ 


مقروءة Ul‏ باستخدام صيخ 

عامة غير حصرية واستخدام 
المعرفات ووصف الموارد 

ومرتبطة بالبيانات والبيانات 


الوصفية الأخرى 





المصدر: معدّلة عن http://sstardata.inio‏ بواسطة .Michael Hausenblas‏ 
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(gs JUI‏ نحو البيانات المفتوحة: 
في حين كان لدى بعض البلدان» مثل الولايات asa]‏ تقليد عريق في جعل بعض 
بيانات القطاع العام متاحة بحرية» وخاصة البيانات ذات الفائدة العالية مثل بيانات 
التعداد» ورسم الخرائط. والطقسء فإن إتاحة الوصولء في بعض البلدان الأخرىء يتم بشكل 
عام من خلال نموذج تغطية التكاليف الذي يتيح البيانات بمقابل مالي وبموجب اتفاقية 
ترخيص معتمدة. ففي المملكة ال متحدةء تخضع الوثائق الحكومية لحقوق التأليف والنشر 
املكية (Crown Copyright)‏ وتحكم البيانات ذات الفائدة العالية بواسطة الصناديق 
التجارية (على سبيل «JULI‏ بيانات الخرائط ضمن هيئة المسح الجغرافيةء وبيانات أحوال 
الطقس في مكتب الأرصاد الجوية) التي تعمل بصفة كيانات احتكاريةء وتتحكم في الوصول 
إلى مجموعات بيانات رئيسية )2006 .(Arthur and Cross 2006; Pollock‏ وعلى مدى 
العقدين الماضيينء تم تجميع مجموعة من الحجج لبناء دَعْوَى إعادة صياغة دور هذه 
الصناديق وفتح بيانات القطاع العام للجمهور. وبصفة عامة» هكن تقسيم هذه الحجج 
والاستحقاقات في خمسة «JU a]‏ والتي ينظر إليها على أنها ذات فائدة لكل من حامل 
البيانات والمستخدم da)!‏ 
أولاً: حيث أن الكثير من البيانات في إطار الهيئات العامة والمنظمات غير الحكومية تتعلق 
بالعمليات التشغيلية لتلك الهيئات» فهي توفر وسيلة يمكن من خلالها قياس مدى 
نجاح مختلف البرامج والأنشطة الخاصة بها. ولذا فإن فتح هذه البيانات للتدقيق 
والرقابة العامة سيجعل أعمال المنظمة وصنع القرار فيها تتمتع بالشفافية ويمكن 
استخدامه لتعزيز ال مساءلة وتقييم القيمة الناتجة JUI Jolie‏ المستثمر Janssen)‏ 
Gordon 2013‏ ;2012(. وقد تزايدت أهمية هذه الشفافية والمساءلة في الخطاب 
العام في pae‏ سياسات التقشف ومحدودية الموارد. وفي سياق المناقشات الجارية 
حول المشترياتء والهدرء والعجز الظاهر في الخدمات العامة. 


ثانيا: يسمح إتاحة الوصول للمستخدمين النهائيين لبيانات المنظمةء على زعم البعض. 
برفع مستوى الوعي حيال القضايا BÈL‏ مما Ji a‏ الاختيار وصنع القرار فيما 
يتعلق بالخدمات العامة ويشجع على المشاركة الفاعلة والواعية في المجال العام 
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.(Janssen 2012: Yiu 2012)‏ وعلاوة على ذلك» فإن إتاحة الوصول للمستخدمين 
النهائيين لبيانات المنظمة يعزز المواطنة الفاعلة والمشاركة السياسية في تشكيل 
كيفية أداء وتنظيم الحكم المحلي )2011 .(Huijboom and Van der Broek‏ 
وهذه» بدورهاء تشجّع الابتكار الاجتماعي» وتعمل على تعزيز العلاقات بين أفراد 
المجتمع» ورفع مستوى النقاش العام )2012 (Yiu‏ ونتيجة «JJ‏ تمكن البيانات 
المفتوحة من بناء الدموقراطية القائمة على المشاركة. 

gaio‏ فتح البيانات حول المنظمة وأدائها على استخدامها هذه البيانات للاستفادة 
في تحسين الكفاءة التشغيلية والإنتاجية من خلال المراقبة واتخاذ القرارات بالأدلة 
coL ils‏ اممشبتة. وعلاوة على «eL JS‏ تحصل وحدات الأعمال داخل ال مؤسسة على 
حق الوصول إلى البيانات وإمكانية استخدامها عبر ا منظمة بكاملهاء مما يؤدي إلى 
رؤى ومعارف حديدة ومزيد من التفكير المشترك والكفاءة );2012 Northcutt‏ 
.(Verwayen et al. 2011‏ وإضافة لذلك» فإنه يمكنهم اكتساب ملاحظات وردود 
قيّمة وتلقي النصح وا مشورة من الوكالات الخارجية التي تقوم باستخدامهاء وتحليلهاء 
وتفسيرهاء مما يرفع من مستوى الجودة. والنزاهة. والفائدة من البيانات. وتؤدي 
هذه التحليلات الداخلية والخارجية إلى تعزيز الحوكمة التنظيمية وإدارة ا مجتمع 
على نطاق آوسع» على سبيل المثال التصدي للغش والتزوير والجرائم الأخرى من 
خلال إنشاء خدمات أكثر فعالية )2011 .(Huijboom and Van der Broek‏ كما 
أنها تمكن من الرصد والتقييم اللمستمرين لأثر السياسات والبرامج الجديدة (مؤسسة 
امعرفة المفتوحة 2012 .(Open Knowledge Foundation‏ 


رابعا: OSE‏ توفير البيانات المفتوحة من إثراء العلامة المميزة, فإتاحة البيانات بحرية يرفع 


من شأن المنظمة: ويدلل على ريادتهاء وروح المبادرة فيهاء ويخدم مهمتها العامة 
ويزيد مستوى الاتصال والتفاعل مع العملاءء والمستخدمين النهائيين ويقود التوجه 
إلى الخدمات المؤسسية )2011 (Verwayen et al.‏ وق المقابلء يبني هذا الثقة 
والسمعة» ويعمل على تكوين انطباع عن اللعايير الفاضلة للمؤسسة. 
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خامسا: بينما تمتلك بعض مجموعات البيانات المنشئة والقائمة في العلن قيمة اقتصادية هامشية, 
على سبيل JELI‏ تلك المتعلقة بالتراث GAII‏ فإن الكثير من مجموعات البيانات الأخرى 
لديها قيمة تجارية كبيرة. ويمكن استخدام البيانات التي & إنشاؤها علناً لإضافة قيمة 
إلى البيانات التجارية AFHI‏ وإنشاء تطبيقات وخدمات جديدة ومن ثم أسواقا جديدة 
وتحسين المعرفة واتخاذ القرارات للأعمال )2012 (Janssen 2012: Yiu‏ ولذا فليس من 
ا مستغرب عندئذ حرص المصالح الصناعية على الدعوة لفتح البيانات المنتجة lle‏ لإعادة 
استخدامها في القطاع التجاريء وخاصة البيانات التي b‏ غرفت باحتوائها وإمكانية 
إنشائها لقيمة كتلك التي تدار من قبل صناديق تداول القطاع العام (على سبيل JELI‏ 
بيانات الخرائط). فهناك من يزعم بأن تقييد الوصول إلى البيانات العامة, والتي تم إنشاؤها 
من أجل المصلحة العامة, يخنق "am‏ ويعمل على فقدان وزن مميت للاقتصاد؛ أي أن 
حصر استخدامها فقط لمن لهم القدرة على تحمل تكلفتهاء هو تسعير لإخراج الآخرين من 
السوق )2012 .(Pollock 2006: Yiu‏ ولذا فإن الاستثمار العام في إنتاج البيانات م يستغل 
بالشكل المناسب كما تم فقدان العديد من الفرص التي من شأنها أن تضفي قيمة على 
نشاطات القطاع الخاص )2012 (Yiu‏ وإضافة إلى ذلك فقد تأثير الارتفاع على الاقتصاد 
الشامل نتيجة فقدان القيمة الناتجة عن فتح البيانات العامة )2012 Northcutt‏ 


وتتفاوت كيفية احتساب أوزان هذه الحجج الخمس عندما يتم تقدهها عبر SM‏ 
القضائية والسياقات المختلفة؛ ومع «AUS‏ فهي تشكل مجتمعة نظاما ذا منطق قوي is‏ 
55 ماوقا à‏ إقناع المنظمات لفتح البيانات الخاصة بهاء GU‏ ليس أقلها أنها تتوافق 
مع العمليات الجديدة للخصخصة (Newliberalism)‏ التي تعزز تسويق الخدمات العامة 
(Bates 2012)‏ وفي الواقع» فإن ال محرك للحجج المتعلقة بفتح البيانات في الغالب هي 
المصالح السياسية والتجارية التي تهدف إلى دفع المؤسسات العامة والمنظمات غير الحكومية 
للحصول على وصول إلى سلعة ثمينةء بدلا من السعي لتحدي مفهوم الملكية الفكرية في i>‏ 
ذاتها )2011 .(Verwayen et al.‏ 

في «Jot‏ ومما لا يثير الدهشة في هذا السياقء أن الحجج والدعاوى لقطاع الأعمال 
لإتاحة بياناتها بحرية لإعادة استخدامها على نطاق أوسع م يجر تطويرها والترويج لها 
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على نحو كاف. ومع ذلك» فإن العديد من الحجج نفسها لفتح بيانات القطاع العام تصلح 
لبيانات الأعمال أيضاء أو على الأقل عناصر مختارة من هذه البيانات. ففتح البيانات من 
شأنه أن يمكن الشركات من الاستفادة من التحليل والرؤى التي تنتج بواسطة الغير من 
المستخدمين النهائيين» والجمع بين البيانات ومجاميع البيانات الأخرى التي تعمل على 
إثرائهم بطرق مثمرةء وتعزيز التعاون مع الشركاء والموردين مما يصنع فعالية في مجال 
الخدمات اللوجستية والمنتجات الجديدة: وبناء علاقة مع العملاء تساعد على توسيع قاعدة 
العملاء وتعزيز الملف التعريفي للشركة وسمعتها )2012 (Deloitte‏ وعلاوة على ذلك 
فإنها قد تساعد على تطوير الشراكات بين القطاعين العام والخاص» às‏ هذا السياق تم 
اعتماد نهج الابتكار المفتوح» والذي حقق نجاحا فيما يتعلق بالبرمجيات ا مفتوحة. والعمل 
على مبدأ أن تقاسم الموارد سينتج المزيد من القيمة التجارية دون الحرص على اكتنازها 
بغيرة والتحرز عليها. ففي الحالات التي تلقت الشركات الخاصة أموالا عامة للمساعدة 
في البحث والتطوير, يمكن إقامة دَعْوَى على أن أي بيانات تنتج عن مثل هذه المحاولات 
ينبغي أن تكون مفتوحة إما بشكل كامل وإما بشكل انتقائي كوسيلة لإنتاج سلعة عامة 
مثل هذا الاستثمار. 


اقتصاديات البيانات المفتوحة: 

هناك عدد من العوامل الكابحة / المثبطة لفتح البيانات» فبعض هذه العوامل تتصل 
با مخاوف المتعلقة بقضايا الضمان والمسؤولية» وا مخاوف بشأن الخصوصية والأمنء والحرج 
المحتمل على جودة البيانات أو مداهاء والكفاءة الفنية لبناء واجهات مناسبة لبرمجة 
التطبيقات (Applications Programming Interfaces- APIs)‏ وإدارة البنية التحتية. 
وحتى الآن» فالأمر الأكثر إثارة للقلق, مع ذلك. هو الشأن المالي. فالبيانات قد تكون غير 
متنازعة بطبيعتهاء مما يعني أنه من الممكن توزيعها بتكلفة هامشية: نظرياً على الأقلء 
لکن ننن الا مقابل d I‏ الأولية جها إل جنب مح Bla]‏ البيانات القاقة وخدمة 
az!‏ )2006 عك20110). وعلى هذا gal‏ قد LE‏ البيانات اممفتوحة موردا مجانيا 
للمستخدمين النهائيين» ولكن إنتاجها ومشاركتها وا محافظة عليها هي بالتأكيد ليست دون 
تكلفة معتبرة (خصوصاً فيما يتعلق بالتقنيات المناسبة وا موظفين المهرة). ففي كثير من 
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«ola!‏ كانت هذه البيانات أيضا مصدرا lus‏ للد ل للمنظمات: وق هالة المركاة 
ميزة تنافسية. زمن ثم يرتكز السؤال الأساسي حول كيفية تمويل مشاريع فتح البيانات 
على نحو مستدام في JB‏ عدم وجود مصادر الدخل الباشر لها. ولذا هناك وجهان لهذه 
المعضلة في التمويل: فمن ناحية هناك التمويل اللازم من قبل الدولة لإنتاج البيانات وجعلها 
مفتوحة. ومن ناحية أخرى هناك التمويل للحفاظ على المبادرات التي يقودها امواطنونء 
والذي يعتمد على العمل التطوعي وال منح» ونماذج الأعمال التي من شأنها تمكين الشركات 
التي تستخدم البيانات المفتوحة من الازدهار والتطور. 

ويختلف تمويل خدمات البيانات الحكومية بين البلدان والوكالات» ففي كثير من الحالات, 
تفرض الضرائب لإنتاج ومعالجة البيانات. ولكن في بعض النظم القانونية والحالات» تكون 
خدمات البيانات معقدة بسبب أربعة عوامل: الأول» أن إجراءها يتم بالتعاقد عليها مع 
أطراف ثالثة لإدارتها وتشغيلها بالنيابة عن الدولة» حيث يضيف الطرف الثالث قيمة 
مخصصة احتكارية أو يجعل البيانات متاحة مقابل رسم مالي. وقد حدث هذا مؤخراً مع 
الرموز البريدية الأيرلندية المرتقبة التي سيتم إدارتها من قبل إحدى الشركات نيابة عن 
الدولة وستمول هذه العملية من خلال بيع وترخيص البيانات. الثاني أن البائعين الآخرين 
يتكتلون بنشاط في سبيل وقف تقديم البيانات المفتوحة لأنه يدمر نموذج أعمالهم. ثالثاء أن 
بعض أجهزة الدولة تعمل باعتبارها صناديق تداول تجاريةء فهي لا تحصل على كل تمويلها 
من عائدات الضرائب» ولكن جزءا كبيراً من دخلها قائم على بيع البيانات. فهيئة المساحة 
الأيرلنديةء على سبيل المثالء تعمل بهذه الطريقة كون أقل من نصف دخلها يأتي مباشرة من 
الدولة في شكل إعانةء ومن المسلم به أن بعض هذه الدفعات التي تتلقاها تأت من وكالات 
حكومية أخرىء ولكنها تأت أيضا من المؤسسات الخاصة وعمليات الشراء الفردية. فإتاحة 
جميع البيانات الخاصة بها مجاناً يقوّض قدرتها على العمل وتمويل الخدمات الجارية 
لها. رابعا أن جعل البيانات مفتوحة لا يتمثل بنشرها في شكل محدّد من قبل الدولة 
فقط. فالكثير من البيانات تحتاج إلى إعادة توظيفها وتنسيقها لتمكينها من أن تكون 
مفتوحة ule)‏ سبيل JUL‏ إبهام المصدر لهاء وتجميعها) ووضع أنظمة جديدة في المكان 
ا مناسب لتحقيق هذا الهدف. وهذه ليست عملية dúo‏ وف أوقات التقشف وخفض 
النفقات يعني هذا إعادة تخصيص التمويل لتغطية من هذا العمل» الذي هو ضروري 
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أيضاً للخدمات الأماسية. وتعني هذه التعقيدات الأربعة أن التصريحات» في كثير من 
الأخيان نان جمع بيانات الدولة قد ثم بالقعل تغطية كفا من خلال فرض الشراقن» 
وأنه ينبغي أن تكون متاحة ds‏ هى ليست بسيظة كما ثراذ لها أن تكون. أما فيما 
يتعلق بالمبادرات التي يقودها المواطنون فهذه أيضاً لديها تكاليف فيما يتعلق بالتوظيف 
والمعدات والخدمات إذا أريد لها أن تكون مستدامة على المدى الطويل. فكيفية تأمين 
هذه الموارد خارج نطاق العمل التطوعي والهدايا تشكل ني معنا حيث تعتمد هذه 
المنظمات. في الوقت الحاضرء إلى حد كبير على التبرعات الخيرية وتمويل الدولة» والتي لا 
يحمل GU]‏ منها ضمانات للتجديد والاستمرار. ومن ثم فمن النتائج المحتملة المترتبة على 
التخفيضات أو التقلبات في القاعدة المالية لخدمات البيانات المفتوحة الانخفاض في جودة 
البيانات» وبط ء الاستجابة, والابتكار, والأداء العام )2006 (Pollock‏ 

وغموما تجادل الدغاة cob‏ المقفوحة يآن الغياز الأفضل لتأمين قاعدة مالية gius‏ 
للبيانات المفتوحة من داخل الدولة وخارجها هوعن طريق الإعانات الحكومية المباشرة 
لتكاليفها. ويرى أنصار هذا النهج أن زيادة الإنفاق العام يعوّض في أربع طرق: الأولى» أن 
إتاحة الوصول المباشر إلى البيانات يحد من بعض التكاليف التي يتكبّدها ا منتجونء مثل 
التوظيف المطلوب للتسويقء واممبيعات» والتواصل مع العملاءء ومراقبة شروط وأحكام 
الترخيص )2006 (Pollock‏ الثانية» أنه يمكن للنموذج ال مفتوح الاستفادة من العمل 
الإضافي الحر والابتكار من جموع اللمستخدمين التي تضيف قيمة معتبرة إلى مجموعات 
البيانات وللمنظمات من ناحية جودة البيانات» وتحليلهاء والمعرفة المستمدة والمنتجات 
الجديدة والابتكارات» والعلاقات والشراكات التجارية الجديدة );2011 de Vries et al.‏ 
AILI (Houghton 2011‏ أن البيانات المفتوحة تنتج قيم فائضة متنوعة للمستهلكينء كما 
تولد سلعا عامة مهمة تستحق استثمار النفقات العامة فيها )2009 «dsl JI (Pollock‏ أن 
البيانات المفتوحة تؤدي إلى منتجات مبتكرة جديدة من شأنها إنشاء أسواق جديدة» وهذا 
بدوره سوف ينتج مداخيل للشركات وإيرادات ضريبية إضافية. وستكون هذه الإيرادات 
الضريبية فائضة عن التكاليف الحكومية الإضافية في فتح البيانات» وبعبارة أخرى فإن نهج 
التكلفة الصفرية أو الهامشية هي أكثر فائدة على المدى الطويل من إستراتيجيات تغطية 
التكاليف واستردادها (المفوضية الأوروبية 2012 (European Commission‏ 
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ولذاء يعتقد أن فتح البيانات ينطوي على إمكانية إيجاد Bae‏ عشرات SLL‏ من اليورو 
bkn‏ في منطقة الاتحاد الأوروبي وحدها (مؤسسة المعرفة المفتوحة Open Knowledge‏ 
.(Foundation 2012‏ ومن الأمثلة المستخدمة لدعم هذا الاعتقاد هو قرار الولايات 
المتحدة بإتاحة بيانات نظام تحديد المواقع العالمية والطقس للجمهور بحرية Pollock)‏ 
coa .(2006; de Vries et al. 2011‏ يدعم JS‏ منها صناعات مليارات الدولارات والتي 
Jg‏ إيرادات ضريبية كبيرة SU‏ أعدادا كبيرة من العمال. وقد قدّرت الإيكونوميست 
(Ihe Economist)‏ في العام 2013م بأن ثلاثة ملايين وظيفة في الولايات المتحدة وحدها 
تعتمد على نظام تحديد المواقع. فلو أن lel‏ قارن استخدام بيانات الطقس العامة في 
الولايات المتحدة وأوروباء فهناك فرق شاسع في استخدامها وإنتاج قيمة مضافة عنهاء حيث 
يشير )2006( Pollock‏ إلى أنه في حين " تساوي الاقتصادين تقريباً في الحجم, فإن صناعة 
أحوال الطقس التجارية في الولايات المتحدة هي أكبر بعشر مرات من نظيرتها في أوروبا كما 
أن صناعة إدارة مخاطر الطقس الوليدة هي أكبر بمائة مرة منها في أوروبا". وبعبارة أخرى. 
تمّ استخدام البيانات العامة المتاحة علناً با مجان أو بقيمتها الهامشية بطرق أنتجت عنها 
قيمة إضافية كبيرة. فأسواق البيانات المفتوحة تتعلق على حد سواء بأغراض مرتفعة (وهي 
oie duel‏ من العماف Sod‏ يدقعون log‏ كر اة مضافة ides‏ ميل «Aib‏ 
المستهدفين بشكل كبير بالتنبؤات الجوية)» وأغراض منخفضة (وهي تستهدف أعداداً كبيرة 
من cd‏ كدي na dolos Quos Lib‏ سيت الحومة seat ibo‏ مق EE‏ 
الإعلانات؛ على سبيل «JULI‏ تطبيقات حركة ا مرور) )2011 .(de Vries et al.‏ ويتضح 
التأثير المحتمل لفتح بيانات القطاع العام في أوروبا من خلال دراسة أجريت على واحد 
وعشرين مشروعاً للبيانات المفتوحة في عشرة بلدان والتي وجدت أن الانتقال إلى التكلفة 
الصفرية أو الهامشية لتكلفة العمليات التشغيلية زادت عدد المستخدمين ما بين ألف إلى 
عشرة آلاف ف «UI‏ كما جذبت العديد من الأنواع الجديدة من المستخدمينء ولا سيما 
الشركات الصغيرة والمتوسطة )2011 (de Vries et al.‏ وهذا يفصح عن أنه على الرغم 
من أن هناك بعض المكاسب الكبيرةء فقد بين )2013( Eaves‏ أن غالبية الإيرادات الناشئة 
ستنتج عن سلسلة طويلة من الادخار والكفاءة والزيادة المتواضعة من التدوير. 
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وعلى الرغم من هذه الحجج. لم يصدر عن هيئة المحلفين حكم قاطع حول ما إذا كان 
فتح جميع بيانات القطاع العام ممكنا اقتصاديا وبشكل مستدام» وخاصة في المدى القصير. 
فهنالك بالتأكيد حالة تتعلق بأن البيانات المفتوحة من الممكن تسويقهاء مما يؤدي إلى 
منتجات عالية ومنخفضة sd‏ والتي هكن بالتأكيد أن تنتج مصادر للدخل وفرص 
العمل. ومع ذلك» وكما بين )2011( de Vries et al.‏ فإن متوسط ما يكسبه مطورو 
العطييقات من ماتا beta‏ ليس سوى ثلاثة آلاف دولار فقطء مع الأخذ بالحسبان أن 
ثمانين بالمائة من تطبيقات الأندرويد المدفوعة يتم م تنزيلها أقل من مئة مرة. وبالإضافة 
إلى «eL JS‏ فقد لاحظوا أنه حتى التطبيقات الناجحة مثل ماي Qu‏ واي (MyCityWay)‏ 
التي تمْ تحميلها أربعين مليوق d dy‏ تنج A lol i‏ ا مو فلك ulad adt us‏ 
رؤوس الأموال في مشاريع محتملة الربح مع الحاجة إلى نموذج مستدام للأعمال. وقد 
يكون من الجيد أن يستغرق الأمر وقتاً لتطوير ابتكارات وأسواق جديدة؛ فعلى سبيل «JULI‏ 
استغرقت الصناعات القائمة على نظم تحديد المواقع سنوات عديدة لتزدهر وتنضج بعد 
قرار جعل البيانات متاحة علنا والذي اتخذ في العام 1984م. كما قد يكون الحال أن بعض 
البيانات لها قيمة كبيرة جدا ولكن دون جدوى اقتصادية» مما يستوجب عادة عدم استمرار 
إعانتها ماليا إذا أريد لها أن تبقى مفتوحة بطبيعتها. 

وفي ظل غياب طرح الاكتتابات الحكومية العامة لجميع التكاليف المتعلقة بفتح البيانات 
الخاصة dy‏ يجري النظر في حلول تمويلية محتملة أخرى ولا سيما نماذج الأعمال المختلفة. 
فقد بين )2013( Ferro and Osella‏ ثمانية نماذج مختلفة لتستخدم, أو قد تستخدم 
لتمويل مبادرات البيانات المفتوحة (انظر الجدول (Y-€‏ ولا تستبعد بعض هذه النماذج 
ا مختلفة بعضا. في حين تعمل نماذج شبه - مفتوحة أخرى على توفير البيانات مجاناً لإعادة 
الاستخدام غير التجاري» وإلزام معيدي الاستخدام للأغراض الربحية بدفع dolia‏ ماديء أو 
الدخول في شراكات بين القطاعين العام والخاص حيث يزؤد القطاع العام البيانات وتقدم 
الشركات الخاصة التمويل والخدمات المضافة لإتاحة الوصول وحقوق إعادة الاستخدام 
às (OECD 2008)‏ نموذج آخرء هكن بناء تحالف يمتلك مجموعة البيانات» وفرق 
العمل» واممواردء والأدوات» ويسهل بناء القدرات» ولكن يتقاضى رسوم العضوية من أعضاء 
التحالف لتغطية الخدمات ذات القيمة المضافة المشتركة. ويتوقف اعتماد أي نموذج. أو 
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مجموعة من النماذج» على ا مجموعة ا مستهدفة لتحمّل تكلفة إنتاج وصيانة البيانات - 
المستخدمينء المحدّثين / البائعين او الحكومة - وإذا كانت المنظمة تسعى لاسترداد التكاليف 
كاملة أو جزء هامشياً منهاء أو حتى قيمة أكبر من التكاليف الكاملة التي يمكن استثمارها 
مرة أخرى في الخدمة )2013 (Pollock 2009; Ferro and Osella‏ 


(Y-€) الجدول‎ 


نماذج التمويل لمبادرات البيانات المفتوحة 


edis‏ للمستخدمين النهائيين منتجا Lle‏ المستوى أو الخدمات 
الى تضيف قيمة إل البيانات ue)‏ سبيل JULI‏ البيانات 
المشتقة. الأدوات والتحليل) مقابل gol‏ كدفعة مقطوعة 
ثابتة, أو رسوماً متكررة, أو الدفع - مقابل - الاستخدام. ودون 
استخدام حقوق احتكارية. وهذا يتيح eb‏ البيانات الحصول 
على مزايا المبادرة والسبق في مجال تسويق وبيع السلع 
التكميلية. 


تقدّم للمستخدمين النهائيين مجموعة متدرجة من الخيارات» 


متضمناً ذلك خياراً مجانياً يشمل عناصر أساسية (على سبيل 
«JULI‏ ميزات محدودة أو عينات من مجموعات البيانات)» 
مع خيارات أكثر تقدماً تحقق قيمة مضافة هقابل رسم مالي. 
تفتح المنتج / الخدمة على سوق أكبر اتساعاً وأكثر شعبية 
وال مزيد من الاستخدام العرضي ا ممتدء مع الاحتفاظ بالخدمات 
/ المنتجات المدفوعةء عالية المستوىء المتاحة للمستخدمين 
الأكثر Laas‏ 
تقدم منتجات / خدمات للمستخدمين النهائيين blea‏ دون 
مقابل» حيث تدعم من خلال سبل التمويل الأساسية الأخرى 
أو غيرها من المنتجات / الخدمات. 


انتج المميز / خدمة 


Premium product / service 


ا منتج المجاني / خدمة 


Freemium product / service 


امنتجات مفتوحة ال مصدر 


Open source 





11 ثورة البيانات البيانات الكبيرة» والبيانات المفتوحة» والبنى التحتية للبيانات» والنتائج المترتبة عنها 


البيانات المفتوحة والبيانات المرتبطة 


نموذج الهدية الترويجية (البنى | يعرض المنتج او الخدمة ابتداء با مجان أو بقيمة مخفضة 
التحتية على نسق ماكنة الحلاقة | (ماكنة الحلاقة) مما يشجع على امتابعة بالاستخدام المدفوع 
والشفرات) بمقابل (الشفرات). وقد يكون إتاحة الوصول إلى واجهات 
å‏ التطبيقات بالمجان: ولكن يكلف هذا الاستخدا 
Infrastructural razor and‏ برمجة بيقات بالمجان ولكن f 0 ins á‏ 
blades‏ امحوسب ال مستخدمين على نموذج دفع ال مستحقات Job Ygl‏ 


(بحسب الاستخدام)» مع دعم هذا النموذج الأخير (الشفرات) 
للنموذج الأول (ماكنة الحلاقة). 
تقدّم خدمات ذات قيمة مضافة عن طريق تنظيف» 025533 
M‏ . السانا“ 5 ة قاسة م“ 
did Demand-oriented platform‏ وريظ البيانات lon‏ يوخر مجموعة iul‏ من 
الادوات التحليلية, وإتاحتها من خلال متجر شامل (متجر 
الشباك الواحد) وتحميل المستخدمين التكلفة من خلال 
التسعير المجاني او المميز (تتصاعد تدريجيا بخيارات 1 و2 


المنصة الموجهة بالطلب 


لاكتساب الكفاءة). 
المنصة الموجهة بالتزويد يُعطى مطورو البرمجيات حرية الوصول إلى البيانات لإنشاء 
الخدمات والمنتجات التي يمكنهم إلى هيئات القطا 
v pce Supply-oriented platform‏ بيعها إلى M‏ = 3 
العام والتي يمكنها بدورها أن تجعلها متاحة للآخرين من 
خلال نموذج ال منتجات المجانية. 
go lel gas‏ الإغلاق تقدّم المنتجات / الخدمات مجاناء ولكن يتلقى المستخدمون 
إعلانا عند استخدام المنتج / الخدمة )85441 للدخل) أ 
E "eu i 8 \Free with advertising‏ ا لل 
تقدم امنتجات / الخدمات من قبل شركات مختلفة وتوصف 
بالعلامات التجارية لها لتشجيع استخدام منتجاتها وخدماتها 
الأخرى (الدعم المتبادل). 
عع امه solid‏ فم دقع EENE‏ 
sS White-label development‏ 
اشتراك يتضمن تكاليف الصيانة والتحديث. 
المصدر: جمعٽ من 2013( (Ferro and Osella‏ . 


تطوير العلامة البيضاء 
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المخاوف المتعلقة بالسيانات المفتوحة: 

باستثناء الكيفية اللازمة لتمويل مستدام لمبادرات البيانات المفتوحة» والخسائر 
المحتملة للشركات التي قامت ببناء نماذج أعمال قائمة على إعادة بيع بيانات القطاع العام 
(de Vries etal. 2011)‏ سيظهر للوهلة الأولى أن هناك عدداً قليلا من السلبيات الناتجة 
عن فتح البيانات العامة للجمهور لإعادة استخدامهاء وأن هناك العديد من الإيجابيات. 
ومع ذلك فقد بدأ في الظهور مؤخراً عدد من الانتقادات المضادة التي تزعم أن حركة 
البيانات المفتوحة ليست محمودة من الناحية السياسية أو الاقتصادية. حيث إن بعض 
العناصر زائفة في أهدافهاء وعلاوة على ذلكء أن هناك عدداً من التبعات الضارة التي 
يمكن أن تنجم عن فتح البيانات ويتضرر منها بعض المواطنين. ولا توحي هذه الانتقادات 
بفكرة التخلي عن التوجه نحو فتح cL‏ ولق ف كد على كحوب أن کون ésta‏ 
coli‏ المفدوحة Les 3S]‏ وتعقلا في إتاحة البيانات» وكيفية استخدامهاء وطرق تمويلها. 
ويمكن تقسيم هذه الانتقادات إلى ثلاث فئات رئيسية: تسهيل البيانات ا لمفتوحة للتوجه 
للخصخصة (تأييد الرأسمالية المطلقة وعدم تدخل الدولة في الاقتصاد) والهيكلة التسويقية 
للخدمات العامة؛ وأنها ترؤج لسياسة توسعية وتزيد سلطة المتسلط؛ وأنها تفتقر إلى 
الاستدامة» والأدوات» وسهولة الاستخدام. 


الخصخصة والهيكلة التسويقية للخدمات العامة: 

برهن )2012( Jo Bates‏ على أن «المبادرات المفتوحة مثل البيانات الحكومية المفتوحة 
(Open Government Data -OGD)‏ تظهر كعملية تاريخية» وليست وقائع محايدة». 
فكما هو الحال مع كل المبادرات السياسية» فإن سياسة البيانات المفتوحة ليست ببساطة 
بديهية أو محايدةء بل هي ترتكز على عقيدة سياسية واقتصادية. فحركة البيانات المفتوحة 
متنوعة وتتكون من مجموعة من الدوائر الانتخابية ذات أجندات وأهداف مختلفة» وليس 
الدافع من ورائها مجرد أي طرف واحد منها. ومع CUS‏ بينت83:65 بأن عامل الشد السياسي 
في حالة حركة البيانات المفتوحة في المملكة Bass]‏ كان ضلا حتى بدأت الشركات الكرى 
تنشط بتكتلها في حملات دعم البيانات dio gt‏ وبدأت المبادرات الحكومية المفتوحة 
تنسجم مع برامج التقشف القسري والهيكلة التسويقية للخدمات العامة. فبالنسبة لها 
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قد استولت الأحزاب السياسية وقطاع الأعمال على حركة البيانات المفتوحة لصالح المصالح 
الرأسمالية ال مهيمنة تحت ستار أجندة / جدول أعمال الشفافية )2012 (Bates‏ 


وبعبارة أخرىء» فإن جدول الأعمال الحقيقي لقطاع الأعمال هو الحصول على البيانات 
المنتجة بتكلفة باهظة دون أي مقابلء ومن ثم الوصول إلى البنية التحتية المدعومة 
بشكل كبير مما يمكنهم من الاستفادة من الأرباح» وف الوقت 15« إزالة القطاع العام من 
السوق وإضعاف موقعه بصفته منتجا لمثل هذه البيانات. ولذاء فبسبب اختفاء الدخل 
من خدمات البيانات (كما في الحالات التي جرى تمويلها من الرسوم وليس من دافعي 
الضرائب)» ومن ثم اختفاء التمويل اللازم لدعم الإنتاج والإدارة المحلية الداخلية» تم دفع 
هيئات القطاع العام إلى الاستعانة بمصادر خارجية لمثل هذه الخدمات من القطاع الخاص 
على أسس تنافسية أو التخلي عن إنتاج البيانات للقطاع الخاص التي عليهم بعد ذلك 
شراؤها منهم )2013 .(Gurstein‏ وهناء يتعين شراء خدمات البيانات والبيانات المشتقة 
من البيانات المفتوحة المتاحة بحرية من منشئ البيانات» في الوقت نفسه الذي يتم إفراغ 
المعارف الأولية لبيانات ال منظمة. وعلاوة على ذلك» وحيث إن البيانات المفتوحة تتعلق في 
كر مق dta] dla 3b GL MI‏ نفس diy‏ وخصوضا Cl age de alat] axe‏ قياس الأداء 
الرئيسية» فهي تعمل على تسهيل إصلاح القطاع العام وإعادة تنظيمه مما يعزز الخصخصة., 
وروح الإدارة العامة الجديدة ومصالح القطاع الخاص )2011 (McClean 2011; Longo‏ 
فمثل هذه العمليات. كما بينت )2013( Bates‏ هي جزء من إستراتيجية سياسية مرسومة 
لفتح els‏ كافة الخدمات العامة تقرهاً للمنافسة بين مزودي الخدمات من القطاع 
الخاص والقطاعات الأخرى» حيث يعمل فتح البيانات الخاصة بالخدمات العامة على تمكين 
مستخدمي الخدمة من استحداث خيارات معلومة ضمن سوق الخدمات العامة على أساس 
التطبيقات التي تعتمد على البيانات التي ينتجها مجموعة من مطورو القطاعات التجارية 
وغير التجارية )2013 التعبير الأصلي). وفي Jio‏ هذه الحالات» فإن جدول أعمال الشفافية 
التي يروج لها السياسيون وقطاع الأعمال هو مجرد تعبير مجازي» فإذا كان أي من الطرفين 
مهتما حقا في الشفافية والحكومة ال مفتوحة 438 سيكون Gels‏ بالتساوي للحق في حركة 
ا معلومات والعمل المتعلق بإفشاء الأسرار )2012 (Janssen‏ وكذلك تخفيف القيود عن 
حقوق الملكية الفكرية على نطاق أوسع )2013 (Shah‏ وبدلاً من ذلك فإن الحكومات 
والشركات بشكل عام مقاومة لهما على حد سواء. 
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السياسات التوسعية وتمكين الممَكن: 

هناك جدل ذو صلة يتمثل في أن الغالب في حركة البيانات المفتوحة مدفوع من 
وجهة نظر فنية واقتصادية» ويركز بشكل كبير على إتاحة الوصول إلى البيانات» وليس على 
سياسات البيانات نفسهاء وما قد تكشف عنه» أو كيفية استخدامهاء و مصالح من uas‏ 
(Shah 2013)‏ وبعبارة 8,91« 3 تسعى الحركة بشكل كبر إلى تقديم صورة تظهرها على 
أنها محيّبة وبديهية. وتعزيز الاعتقاد بأن فتح البيانات بطبيعته شيء جيد في a‏ ذاته. 
وبالنسبة لآخرينء OB‏ إتاحة الوصول إلى البيانات هو مجرد وجه واحد فيما يتعلق بمفهوم 
الانفتاح» وعلى القدر نفسه من الأهمية هو ما تتكوّن البيانات منه» والكيفية التي Sc‏ بها 
إنشاء مجتمع أكثر اعتدالاً وإنصافاً. فإذا كانت حركة البيانات المفتوحة تخدم فقط المصالح 
الرأسمالية من خلال فتح البيانات dalol‏ وتحتفظ بالبيانات الاحتكارية الخاصة خلف 
أنظمة جدران الدفع doe)‏ رسوم الاشتراك) وحمايتها بأنظمة الملكية الفكرية» وتمكن 
بصورة أكبر أولئك الممَكنين بالفعل وحرمان الآخرين منهاء فإنها تكون قد فشلت في جعل 
المجتمع js‏ دمقراطية وانفتاحاً )2013 (Gurstein 2011; Shah‏ 

ففكرة أن البيانات محايدة وموضوعية في طبيعتها تطرح ضمناً في معظم المناقشات 
المتعلقة بالبياتات اللفتوحة JS-U olo‏ إمكانية الوصول لهذةه البياثات واستخدامها 
.(Gurstein 2011; Johnson 2013)‏ بيد أن القضية ليست EUIS‏ فمع الاحترام لفتح 
البيانات 3 lg‏ يوکن )2013( Johnson‏ وجود درجة عالية من الامتياز الاجتماعي والقيم 
الاجتماعية الكامنة ضمناً في بيانات القطاع العام فيما يتعلق بماهية البيانات المنتجة, 
وتعلقها من ولماذا Y)‏ سيما في المجالات التي تعمل كأنظمة تخصصية. مثل أنظمة الرعاية 
الاجتماعية: وأنظمة إنفاذ القانون»» التي تتمثّل مصالحها ضمن مجموعة البيانات وأيضاً 
تلك التي يتم استبعاد مصالحها. وهكذا فإن هياكل القيمة متأصلة في مجموعات البيانات 
والتي تشكل بدورها التصميم والتفسير لها وربما تعمل على نشر المظام وتعزيز المصالح 
Asl‏ 

فا مواطنون متفاوتون من حيث إمكانية الوصول إلى الأجهزة والبرامج المطلوبة لتحميل 
ومعالجة مجموعات البيانات المفتوحة, كما أن لهم مستويات مختلفة من المهارات اللازمة 


MA‏ ثورة البيانات البيانات الكبيرة» والبيانات المفتوحة» والبنى التحتية للبيانات» والنتائج المترتبة عنها 


البيانات المفتوحة والبيانات المرتبطة 


لتحليل» وتأطيرء وتفسير البيانات )2011 .(Gurstein‏ وحتى لو امتلكت بعض ال مجموعات 
القدرة على تقديم فهم مقنع للبيانات» V]‏ أنهم لا ملكون بالضرورة الاتصالات اللازمة 
لاكتساب التأييد الجماهيري والتأثير على النقاش, أو الحنكة السياسية Jolie‏ خصم جيد 
التجهيز والدهاء. ومن ثم» فإن الدهوقراطية المحتملة للبيانات المفتوحة مفرطة في التفاؤلء 
إذا أخذ بالحسبان معظم المستخدمين الذين لديهم درجة عالية من المعرفة التقنية وملف 
تعريفي سياسي قائم )2011 (McClean‏ فالواقع أنه هكن للبيانات المفتوحة أن تعمل على 
زيادة تمكين السلطة وإعادة إنتاجها وتعميق اختلال توازن القوى )2011 .(Gurstein‏ ومن 
الأمثلة التي يستشهد كثيراً بها على هذا الأخير هو رقمنة سجلات الأراضي في ولاية كارناتاكا 
(Karnataka)‏ الهند» حيث عمل مشروع البيانات ا مفتوحة. والذي e‏ الترويج له باعتباره 
مبادرة لصالح الفقراءء على حرمان الفقراء من خلال تمكين ذوي امموارد المالية والمهارات من 
الوصول إلى البيانات التي سبق حجبها وإعادة اقتطاع أراضيهم بوضع اليد بغية الاستيلاء 
عليها )2012 .(Gurstein 2011; Slee 2012; Donovan‏ لقد سهلت البيانات المفتوحة 
في هذه الحالةء وبعيداً عن العمل على مساعدة كل المواطنين» على التغيير في حقوق ملكية 
الأرض ونقل الثروة من الفقراء إلى الأغنياء. وبعبارة أخرىء فإن فتح البيانات لا يعني عملية 
متأصلة في الدمقراطية وتعزيزهاء بل إن الواقع أنه يمكن للبيانات المفتوحة أن تعمل أداة 
للسلطة التأديبية )2013 (Johnson‏ 


ومن المهم هنا أن التنبّه إلى أن إنتاج البيانات الحكومية يكون لأغراض الحوكمة, 
وهي تتألف من نوعين رئيسيين: الأنشطة المتعلقة بأنشطة الدولة والأنشطة المتعلقة 
بالمواطنينء والأماكن. والأعمال. فالنوع الأول exp‏ بكيفية عمل الدولة: وعند إتاحة هذه 
البيانات بشفافيةء يمكن استخدامها لتقييم الأداء وا لمساءلة. وقد يقف قلة X‏ جعل 
مثل هذه البيانات متاحة للجمهورء على الرغم من الحاجة لتقدير مثل سياسات ال مكاشفة 
هذه خاصة إذا كانت التدابير المستخدمة ذات تأثير مشؤه لتقديم الخدمة وتعمل على 
التلاعب ببيانات التقييم (بالتوافق مع قانون كامبل -Campbells Law-‏ انظر الفصل 
السابع). وهذا يؤثر بدوره سلبا في ماهية الخدمات المقدمة وجعل الحياة سيئة لأولئك 
الأشخاص الذين يتلقون الخدمة. ويتكون النوع الثاني من السجلات الشخصية والمؤسسية 
الحساسة للغايةء وم يتم إنشاؤها بهدف مشاركتها وتبادلها مع الآخرين. وف الواقع.» 
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يتوقع المواطنون لها أن تكون محمية بموجب قوانين الخصوصية وحماية البيانات. وحتى 
عندما يتم تجريد هذه البيانات من البيانات التي تشير إلى هوية أشخاص معينين أي 
جعلها مجهولة (Anonymised)‏ وعرضها مجملة: فإنه مكن للبيانات أن تكون على 
درجة من الحساسية والسياسية بصورة كبيرة. فخذء على سبيل المثالء بيانات الرعاية 
الاجتماعية والصحية المنقحة نسبياً والمجمعة في وحدات مكانية (على سبيل ال مثال» مستوى 
الحي)» فهذه البيانات تمثل أداة لتوجيه التدخلات ام موجهة الرامية إلى معالجة المعوقات 
الاجتماعية» كما أن لها إسهامات مفيدة في تحليل البيانات التي تسعي اجتماعياً إلى فرز 
المواطنين والتعريف عنهم فيما يتعلق بالقروض الائتمانية والتأمين ضد المخاطرء ويمكن من 
ثم استخدامها لإنشاء ملفات تعريف مناطقية والتي توصم موضعاً ما dads‏ من الاستثمار 
فيه (انظر الفصل العاشر). وبعبارة أخرىء يمكن إعادة توظيف البيانات لأغراض مختلفة 
بطرق شتى والتي لها مخرجات متباينةء وهناك أسباب مشروعة لتوخي الحذر فيما يتعلق 
ها يتم الإفراج عنه من البيانات الحكومية ومقاومة شعار التبسيط المستخدم من قبل بعض 
المدافعين عن البيانات المفتوحة "إنها بياناتناء لقد دفعنا مقابلهاء وينبغي أن يكون UJ‏ حق 
الوصول إليها". 


الاستدامة والفائدة وسهولة الاستخدام: 

ETT $3‏ و الان غل جاب :قوفن الوضول «Lis ball]‏ 
مبادرات البيانات اممفتوحة» وكان هناك عدم إيلاء اهتمام كاف لاستدامة المبادرات والكيفية 
التي يتم بها استخدام البيانات وتوظيفها. ففي دراسة أجريت على عدد من مشاريع البيانات 
المفتوحة المختلفة أوضحت )2012( ob Helbig et al.‏ العديد منها تركز بشدة على الناحية 
التقنية الفنيةء ويمكن فهم هذه المشاريع على أنها «تزيد قليلاً عن المواقع المرتبطة cle‏ 
بيانات de gixa‏ ودون أي مراعاة لسهولة الاستخدام, وجودة المحتوىء أو عواقب استخدامها». 
والنتيجة هي مجموعة من مواقع البيانات المفتوحة التي تعمل أكثر كحاويات للبيانات 
أو مكبات البيانات» بحيث تفتقر إلى الصفات المتوقعة في البنية التحتية العاملة للبيانات 
والمنظمة dus EX‏ مثل البيانات النظيفة» ذات الجودة العاليةء والتي جرى التحقق من 
صحتهاء وقابليتها للتشغيل المتبادل Le‏ يتوافق مع معابير البيانات ولها التعريف الوصفي 
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ا مناسب ومجموعات تسجيل كاملة (الوثائق المرتبطة بها)؛ أي سياسات المحافظة والنسخ 
الاحتياطي والتدقيق؛ وسياسات إعادة الاستخدام والخصوصية والأخلاقيات» والترتيبات الإدارية 
وآليات تنظيم الإدارة والحوكمة؛ والاستقرار JUI‏ وخطة طويلة الأجل للتنمية والاستدامة 
(انظر الفصل الثاني). كما تفتقد العديد من المواقع للأدوات المناسبة والمواد السياقية لدعم 
تحليل البيانات» وعلاوة على ذلك فإن غالب مجموعات البيانات المنشورة تكون صعبة الأخذ 
والاستفادة منهاء حيث تتألف من تلك التي يسهل نشرها وتحتوي على بيانات غير حساسة 
كما أن لديها فائدة منخفضة Uli LALI às TE:‏ ما تبقى البيانات الأكثر صعوبة وتطلباً 
لجعلها مفتوحة في حالة مغلقة. بسبب قضايا حساسيتها أو لأنها تتطلب المزيد من العمل 
الإداري للامتثال لقوانين حماية البيانات )2013 (Chignard‏ 


ويتمثل جزء من المشكلة في أن العديد من مواقع البيانات المفتوحة هي استجابة عنيفة 
وجاهزة لظاهرة ناشئةء وقد تم بناؤها من قبل متحمسين ومنظمات ممن لديهم خبرة 
قليلة في أرشفة البيانات أو الاستخدام السياقي للبيانات التي تم فتحها. وقد تم دعمها 
والترويج لها من خلال الملتقيات المكثفة لمطوري البرمجيات (الهاكاثونات» (Hackathons‏ 
ومنتديات العطل الأسبوعية لمجموعات الاختصاص (Data Dives)‏ التي تعيد طرح 
وإنتاج العديد من هذه القضايا. وكما McKeon (2013) and Porway (2013) ssi‏ فإن 
هذه الأحداث والتجمعات التي تدعو المبرمجون والأطراف المعنية الأخرى لبناء تطبيقات 
puedo‏ البيانات المفتوحة لها فائدة محدودة. ففي حين أنها تركز الاهتمام على البيانات 
Axis‏ وسيلة جيدة للتواضك» V]‏ أن أولقك الذي يقوموق iadh‏ غالبا ما يقتقرون إل 
المعرفة السياقية المعمّقة قيما يتعلق ها تشير البيانات إليه» أو ينتمون إلى مجموعة سكانية 
معينة ليست بالضرورة معبّرة عن شريحة مجتمعية أوسع BUS‏ (على سبيل ال مثالء الشباب 
والمتعلمون والتقنيون)» ويظنون أن المشاكل الهيكلية العميقة يمكن حلها من خلال الحلول 
التقنية. إنهم «كيان مؤلف من مجتمع صغير من المتطوعين ا متحمسينء وليسوا من 
الأشخاص الذين لديهم مصلحة كبيرة في رؤية المشروع ينجح» )2013 .(McKeon‏ وعلاوة 
على ذلك» لا تزال الحلول التي تم إنشاؤها في هذه اللقاءات على إصدارها JYI‏ مع قليل 
من المتابعة بعد انتهاء الحدث ودون تحديث أو صيانة أو تطوير لاحق. وكان جواب 
Porway's (2013)‏ لبناء حلول pod‏ لتغيير مناسب هو الجمع بين أولئك الذين يفهمون 
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البيانات وال مشكلات القائمة على أرض الواقع مع أولئك الذين يستطيعون برمجة التطبيقات 
وبنائها والمحافظة عليهاء وقد اقترح )2013( McKeon‏ عقد اجتماعات تخطيطية مسبقة 
وتوصيات توجيهية بعد الحدث تهدف إلى استدامة ال مخرجات وإنشاء مجتمع على المدى 
الطويل. وبعبارة أخرىء هناك حاجة للتوفيق بين الخبرات الموجودة والخبرات في تطوير 
التطبيقات. والحاجة نفسها مطلوبة مع مواقع البيانات المفتوحة, حيث تتطلب تعلم 
الدروس المستفادة من أولئك الذين عملوا لفترة طويلة سابقة في الأرشفة وقطاع أعمال 
فال البياناكه lone‏ ذلك آمك اللتعفوطات الأرشيقية والعلياء والسقرافيون: 

ونفيجة لهذه القضايا daas ssl‏ المختلفة: وبدلاً من إنشاء 892 إيجابية (Virtuous Cycle)‏ 
بحسب ما تفترض حركة البيانات ال مفتوحة. حيث الإفراج عن اللمزيد والمزيد من مجموعات 
البيانات» في المزيد من الأشكال والصيغ: ينتج عنه مزيد من الاستخدام» ومن ثم الإفراج عن 
ا مزيد من البيانات مستقبلاً إلا أن العديد من المواقع, كما لاحظت )2012( Helbig et al.‏ 
عانت من انخفاض معدلات التصفح لها وتراجعها لأنها لا تشجع على الاستخدام أو لا تقدم 
التسهيلات للمستخدمين في هذا الخصوصء وتقتصر خدماتها على عوامل أخرى مثل ممارسات 
إدارة البيانات وعرض الجهد المؤسسي المبذول والسياسات الداخلية ال معمول بها. فبعد الشرارة 
الأولى من الاهتمام» تراجع استخدام البيانات بشكل ملحوظ للغاية بسبب الكشف عن القيود 
المفروضة على البيانات ومحدوديتها ونضال ا لمستخدمين من أجل إيجاد طرق لكيفية استخدام 
وتحليل البيانات بشكل مربح. وقد لاحظ )2011( McClean‏ على سبيل JELI‏ أن التحليل 
الناشِي عن البيانات المفتوحة كان له تأثير محدود على النقاشات السياسية. وخلص فيما 
يتعلق بنظام المعلومات ال مجمّعة على الإنترنت (كوينز (COINS‏ الخاص بالبيانات اطالية 
الحكومية في المملكة المتحدة: إلى أنه بعد 

d e‏ قصيرة من اهتمام وسائل الإعلام في منتصف عام 2010, وفي أعقاب إطلاقه.... 
فإن التقارير التي تشير صراحة إلى نظام كويّنز غدت الآن نادرة للغاية» كما أن العاملين في 
الصحافة الذين كانوا الأكثر اهتمامًا بالحصول على حق الوصول إليه قد صرّحوا بأنه Cu b‏ 
فائدته كمحرّك فاعل للصحافة على وجه الخصوص. 
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البيانات المفتوحة والبيانات المرتبطة 


OB تشر البياقات دورياً على سبيل المثالء بصورة فصلية أو سنوية»‎ ez deus 
بمشاريع محددة مثل التقارير الاستشارية‎ lta ig bos الاستخدام ميل إلى أن يكون‎ 
من الاستخدام الذي قد يتوقعه اطرء لبيانات تتغير بطبيعتها‎ bL JS] بدلا من 3929 نمط‎ 
هذه الحالات» لاحظت‎ Jio بصورة مستمرة أو لديها قيمة اقتصادية عالية. ففي‎ Ul 
أن مجموعة من حلقات 3535 الفعل السلبية قد أبطأت توفير‎ Helbig et al. (2012) 
البيانات واستخدامهاء ومن ثم زيادة خفض الاستخدام. ولذاء فبعد بعض «المكاسب‎ 
السريعة» الأولية» يكمن الخطر في تحوّل أي دورة إيجابية من كونها إيجابية إلى سلبية,‎ 
وتقويض الأساس المنطقي لتمويل الحكومة امركزية ممثل هذه ال مبادرات وكونها عرضة‎ 
للتوقف اممفاجئ. إن المفتاح لتجنب نشوء مثل هذه الدورة السلبية هو التأكد من‎ 
تركيز أي مبادرة بأكبر قدر ممكن على جانب الطلب كما في جانب العرضء وأنها توفر‎ 
للمستخدمين بيانات قابلة للتشغيل المتبادل والأدوات التحليلية وغيرها من الخدمات‎ 
التي تسهل استخدام وإضافة قيمة للبيانات» بدلا من مجرد ربط الملفات.‎ 


الخلاصة: 

عند أحد المستوياتء تعد قضية البيانات المفتوحة والبيانات المرتبطة بديهية - حيث تسهم 
البيانات المفتوحة في صنع الشفافية والمساءلة وا مشاركة والاختيار والابتكار الاجتماعي والكفاءة 
والإنتاجية وتعزيز الحوكمة والابتكار الاقتصادي وتكوين الثروات. في حين تعمل البيانات المرتبطة 
على تحويل المعلومات الموزعة عبر شبكة الإنترنت إلى شبكة دلالية يمكن من خلالها القراءة الآلية 
للبيانات وربطها معاً. وعليه تحمل البيانات المفتوحة والبيانات المرتبطة في طياتها الكثير من 
الوعود والآمال والقيمة مع اعتبارها معان محفوفة با مخاطرء فواقع الحال بالنسبة للبيانات 
اللفعوضة والساتات dais 3S1 das,‏ كما أن a a‏ الاقبصادية لها ليست واضحة على 
الإطلاق. ويبدو أن للبيانات المفتوحة والبيانات المرقطة تكاليق شامفية «ALIS‏ ولكن الحاحة 
قائمة في عملية إنتاجها والطاقم الفني والجهاز المؤسسي لتسهيل استخدامها والحفاظ عليها مما 
يلزم تكاليف حقيقية من حيث العمالةء وا معدات» واموارد. و الواقع» فإن البيانات الفتوحة 
بعيدة كل البعد عن كونها مجانيةء ولكن حتى OVI‏ م يتم وضع نموذج متماسك لتمويل مستدام 
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الفصل الثالث 


لبادزاث البيانات المفشوعة دون dile]‏ حكومية, كما أن فواكد البيانات Arial‏ من حيث gl3l‏ 
قيمة مضافة على فائض الاستهلاك والمشاريع التجارية الجديدة والمنتجات المبتكرة, والتكاليف 
قد قابلها إيرادات ضريبية إضافية افتراضية إلى حد كبير أو بدأت بالتحقق فقطء وعلاوة على 
ذلك فإن العواقب السلبية المحتملة لفتح البيانات لم تستكشف بعد بالكامل. 

فهناك حاجة إلى الدفع بمزيد من الاهتمام النقدي لكيفية تطور مشاريع البيانات المفتوحة 
كظاهرة تقنية اجتماعية مقعدة ومرتبطة بطائفة متنوعة من البرامج. والمعنيين» وأصحاب 
المصلحة. وحتى الآنء تمحورت الجهود حول العمل السياسي والتقني المتعلق بإقامة مشاريع 
البيانات ا مفتوحةء وم يتم العمل بشكل كاف على دراسة هذه التحركات المادية والتي تلامس 
العديد هن الحوانب وعواقنيا deuzig‏ ذلك فاا نض إل دساف انات dala]‏ لع 
مشاريع البيانات المفتوحة, والتجمعات المحيطة به والتي تعمل على صياغتهاء والطرق 
الفوضوية؛ والطارئة والعلائقية التي تتكشف بمرور الوقت. ولن تظهر صورة أكثر اكتمالاً 
للبيانات المفتوحة والبيانات المرتبطة إلا من خلال مثل هذه الدراسات التي ستكشف عن كل 
من الإيجابيات والسلبيات Jib‏ هذه المشاريع وتوفر إجابات عن أسئلة معيارية بشأن الكيفية 
التي ينبغي تنفيذها بها ومعالجة قضايا الاستدامة وسهولة الاستخدام والسياسات المتعلقة بها. 
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الفصل الرابع 
البيانات الكبيرة (Big Data)‏ 


تتبع )2012( Liz Francis Diebold‏ استخدام مصطلح «البيانات الكبيرة» إلى منتصف 
التسعينيات (1990s)‏ حيث استخدم لأول مرة من قبل جون ماشي «(John Mashey)‏ 
كبير العلماء السابق المتقاعد من شركة سيليكون غرافيكس. للإشارة إلى معالجة وتحليل 
مجموعات البيانات الضخمة. وقد كان المصطلح قليل الجذب في البداية. ففي العام ۲۰٠۸‏ 
استخدم عدد قليل جدا من الناس مصطلح «البيانات الكبيرة»» سواء في المجالات الأكادهية 
أو الصناعية. وبعد خمس سنوات أصبح مصطلح «البيانات الكبيرة» التعبير الطنان الأكثر 
شيوعاً à‏ الاستخدام في دوائر الأعمال ووسائل الإعلام الشعبية. مع تعليقات دورية في 
الصحف الأكثر انتشاراء مثل صحيفة النيويورك تامز (New York Times)‏ والفاينانشال 
تامز (Financial Times)‏ ومقاطع وأعداد خاصة في المجلات العامة والمجلات العلمية 
dt.‏ عام الاقتصاد (Economist)‏ والوقت (Time)‏ والطبيعة (Nature)‏ والعلوم 
(Science)‏ لقد كان هذا الانتشار وزيادة الاستخدام المرتبطة به هو ما آذى بالفعل إلى 
إعلان غارتتر à (Gartner)‏ يناير (2013) عن انتقال تقنية البيانات الكبيرة على طول دورة 
الدعاية (Hype cycle)‏ (كما يطلق عليها نموذج النضج التقني) من مرحلة «ذروة تضخم 
التوقعات» إلى «مستوى خيبة الأمل» )2013 (Sicular‏ مع إعلان بعض الدغاة سابقا عن 
موت «البياتات الكيرة» بصفته مصظاحا ذا Car uina‏ أصبح مصطلحا متشسعبا وواسع 
النطاق للغاية في التعريف de)‏ سبيل (de Goes 2013 JL‏ فبعض أوائل الشركات 
التي تبنت المفهوم تصارع من أجل تحويل الاستثمارات في البيانات الكبيرة إلى عوائد ربحية 
والبعض يشككون في فوائدها المحتملة. ومع ذلك Jb‏ قطاع الأعمال والقطاع الحكومي 
العام وممولو البحوث على قناعتهم بارتفاع منحنى التنوير (Slope of Enlightenment)‏ 
للبيانات الكبيرة OW‏ إلى مستوى الإنتاجية (Plateau of Productivity)‏ عبر دورة 
الإعلان أو نموذج النضج التقني» بل وأكثر من «US‏ أنها وجدت لإحداث تغيير جذري في 
كيفية عمل العلوم وإجراء الأعمال )2013 Siccular‏ انظر أيضاً للفصلين السابع والثامن). 
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الفصل الرابع 


وكما نوقش في الفصل الثاني فقد وجدت ولفترة طويلة من الزمن مجموعات ضخمة من 
بيانات عبر الحكومات والصناعات والأوساط الأكادهية التي S‏ استخراج المعلومات منها 
من أجل تقديم مزيد من الرؤى والمعرفة» فالإدارات والوكالات الحكومية أنتجت بشكل 
روتيني كميات ضخمة من البيانات. على سبيل (JUL‏ قامت إدارة المحفوظات والسجلات 
الوطنية في الولايات المتحدة في عام ۲١٠۳‏ بتخزين ما يقارب £0 مليون قدم مكعب من 
الوثائق المادية من وكالات السلطة التنفيذية الأمريكية, وال محاكم» ومجلس النواب» ومقر 
الرئاسة (وهي خمسة ف المائة من سجلات الحكومة الاتحادية) مما يضيف ثلاثين ألف 
قدم بصورة خطية سنوياً )2013 (Ellis‏ بالإضافة إلى خمسمائة تيرابايت من البيانات 
الرقمية. كما تم بالمثل جمع بيانات للشركات عن عملياتهاء والأسواقء والعملاء وقواعد 
بيانات هائلة من البيانات العلمية التي gi‏ جمعها ومشاركتها من بداية العلم الحديث. 
لذلك» ما المقصود من مصطلح «البيانات الكبيرة»» بالنظر إلى كميات البيانات الناتجة في 
المجالات السابقة؟ 

فكما هو شأن العديد من المصطلحات المستخدمة للإشارة إلى الاستخدام المتسارع في 
التقنيات وا ممارسات. لا يوجد تعريف أكاديمي محدد أو صناعي متفق عليه للمصطلح 
البيانات الكبيرةء إلا أن الكثير من التعاريف الشائعة تشر إلى الثلاثية المكررة للأحرف 
الابتدائية (3Vs)‏ للخصائص المميزة للبيانات الكبيرة: الحجم (Volume)‏ والسرعة 
(Velocity)‏ والتنوع )2012 .(Variety) (Laney 2001; Zikopoulos et al.‏ فالبيانات 
الكبيرة تتميز بأنها: 
٠‏ ضخمة في الحجم» أي تتكوّن من تيرابايت أوبيتابايت من البيانات. 
٠‏ عالية de LJ‏ أي أنها Us‏ بشكل آني أو فوريء أو قريباً من الزمن الحقيقي. 
٠‏ مختلفة من حيث تعدد تنوّعهاء حيث تتنؤع البيانات بين المنظمة وغير ا منظمة في 

طبيعتهاء كما تتنوع في الغالب من حيث مرجعيتها الزمانية واطكانية. 

فخلال زمن ما قبل البيانات الكبيرة. تقيّدت قواعد البيانات بين هذه الخصائص الثلاث: 
حيث كان من الممكن لقاعدة البيانات الجمع بين خاصيتين اثنتين في آن واحد (ضخمة 
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البيانات الكبيرة 


وسريعة» متنوعة وسريعة» وكبيرة ومتنوعة) )2012 .(Croll‏ إلا أنه مع تعزيز قدرة ا معالجة 
الحاسوبيةء والتصاميم الجديدة لقواعد البيانات» والتخزين الموزع (انظر الفصل الخامس). 
أصبح تحقيق الثلاثة مجتمعة في وقت واحد ممكناً مما يتيح أشكلاً جديدة للتحليل 
وتقديم عروض مفصلة للغاية للنظم الضخمة وامتغيرة باستمرار. وعدا عن الخصائص 
الثلاث السابقة. أشارت المؤلفات الصادرة مؤخرا إلى عدد من الخصائص الرئيسية الأخرىء 
حي تميق coll‏ الكبيرة zit esas La‏ 


املك ف diis‏ جية : لتغطية كامل مجتمع أو نظم الدراسة ò)‏ = الجميع)» أو 
على الأقل توفر حجم عينات أكبر من تلك التي يجري استخدامها في دراسات البيانات 
التقليدية أو الصغيرة. 


٠‏ متناهية في دقتهاء حيث تهدف إلى أن تكون مفصّلة قدر الإمكانء ومفهرسة بشكل فريد 
2 تحديد الهوية. 

٠‏ علائقية بطبيعتهاء كونها تحتوي على حقول بيانات مشتركة تمكن من الربط بين 
مجموعات بيانات مختلفة. 

٠‏ مرنة» حيث تحمل سمات التفرّع (يمكن إضافة حقول بيانات جديدة بسهولة) مع قابلية 
التوسع (يمكن التوسع في حجمها بسرعة). 
boyd and Crawford 2012; Dodge and Kitchin 2005; Marz and Warren)‏ 

.(2012; Mayer- Schonberger and Cukier 2013 


وبالنظر إلى الحملة الدافعة إلى التحويل الرقمي (Digitisation -à 243 JI)‏ للبيانات 
التقليدية الصغيرة والتوسع فيها ضمن البنى التحتية الرقمية التي تتميز بالضخامة والتنوع 
مثل ال محفوظات الأرشيفية «dal JI‏ التعدادات AILI‏ وا مجموعات الثقافية والاجتماعية 
التراثية؛ انظر الفصل (JI‏ فقد كانت السرعة والخصائص الإضافية هي ما ميزت البيانات 
الكبيرة وجعلت متها ابتكاراً (Christensen's 1997) ltal‏ وغير بصورة جذرية tanb‏ 
البيانات وما يمكن عمله من خلالها (انظر الجدول .)7-١‏ فعلى سبيل JELI‏ يتميز ا مسح 
الأسري الوطني بكر الحجم. والدقة المتناهية. وقوة العلائقية:. إلا أنه يفتقر إلى السرعة 
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الفصل الرابع 


(تتغير البيانات مرة واحدة في السنة )» والتنوع (يتكوّن من ثلاثين سؤالاً منظماً). والشمول 
(حيث تقتصر العينة على فرد واحد من عشرين أسرة). والمرونة (كون حقول البيانات 
ثابتة ولا تتغير خلال المسوحات امتعاقبة للتمكن من تحليل السلاسل الزمنية). ففي هذا 
الفصل تمّ إيراد الخصائص السبعة للبيانات الكبيرة ويناقش الفصل التالي العوامل المساعدة 
للبيانات الكبيرة ومصادرها. 


:(Volume) الحجم‎ 

شهد العقد الماضي انفجاراً في كمية البيانات التي & إنتاجها ومعالجتها بشكل يومي. 
وكما عنونت مجلة وايرد (Wired)‏ بشكل رئيس في عددها الخاص للعام 2008: نحن ندخل 
«عصر التيرابايت» (وفي الواقع: لقد ولجنا بالفعل في عصر الزيتابايت؛ 7002 بايت). وقد 
سعت العديد من الدراسات لتقدير وتتبّع الأحجام المعنية (على سبيل Hilbert and JELI‏ 
(López 2009; Gantz and Reinsel 2011; Short et al. 2011‏ واستخدمت هذه 
الدراسات منهجيات وتعاريف مختلفة» ولكنها أجمعت بالكلية على أن معدل نمو البيانات 
كان Loss‏ في نطاقه. وعلاوة على ذلك» فهي قائمة على النمو باطراد أكبر في ا مستقبل 
المنظور. إن أبسط طريقة لتوضيح هذا النمو هو إعطاء بعض الأمثلة على تقديرات عامية 
لأحجام البيانات وبعض التقديرات المتعلقة بكيانات محددةء ولتوفير إطار مرجعي» Lai‏ 
الجدول (£-V)‏ بصورة مختصرة كيفية قياس حجم البيانات. 

)6-١( الجدول‎ 


مقاييس البيانات الرقمية 


هى اختصار لتعبير «الخانة الثنائية»» حيث تستخدمه 
الحاسبات لتخزين ومعالجة البيانات على صورة الرمز 


الثنائي (0 أو1) 


ثمانية خانات ثنائية | مساحة تخزينية كافية لتمثيل رموز الأبجدية الإنجليزية 
(8 بت) والأرقام باستخدام الرموز الثنائية 
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البيانات الكبيرة 


من كلمة «الألف» (Thousand)‏ باليونانية. فالصفحة 
الواحد من النص المطبوع JAS‏ بحوالي 2 كيلوبايت 
من كلمة «ضخم» (Large)‏ باليونانية. فكامل أعمال 
شكسبير الأدبية jiis‏ حجمها ب 5 ميجابايتات في حين 
يقذر حجم املف الصوت امموسيقي بحوالي 4 ميجابايت 
من كلمة «هائل» (Giant)‏ باليونانية. ففيلم من ساعتين 
من كلمة “عملاق' (Monster)‏ باليونانية. فالكتب 
المفهرسة في مكتبة مجلس النواب الأمريكي (الكونغرس) 
یقذر حجمها بحوالي 15 تيرابايت 


البريد الأمريكي في العام 2010 بنحو 5 بيتابايت. 


مكافئة لبيانات عشرة بلايين نسخة من مجلة عام الاقتصاد 
.(The Economist)‏ 


يقدّر ال مجموع الكلي للمعلومات في الوجود في عام 2010 
بحوالي 1.2 زيتابايت 


0 أو210 بايت 


0 ميجابايت؛ 
0 بايت 
0 غيغابايت؛ 
0 بايت 


0 بيتابايت؛ 
0 بايت 

زيتابايت (ZB)‏ | 1000 إكسابايت؛ 
0 بايت 

يوتابايت (YB)‏ | 1000 زيتابايت؛ 
0 بايت 


تم وضع الاختصارات من قبل المنظمة الحكومية الدولية ántergovernmental organization‏ 


وال مكتب الدولي للأوزان والمقاييس International Bureau of Weights and Measures‏ تم 
إضافة dass‏ يوتابايت وزيتابايت في العام 1991؛ المصطلحات للكميات الأكبر b‏ يتم وضعها بعد. 


المصدر:مجلة عام الاقتصاد )2010( «(The Economist)‏ تم إعادة إنتاجها بإذن عام الاقتصاد. صحيفة عام 
الاقتصاد ا محدودةء لندنء الإصدار 11 مارس 2014. 





Cobb ۸۰۰۰۰۰ تخزين‎ e م٠٠٠١ العام‎ à أنه‎ Zikopoulos et al. (2012) وقد بين‎ 

من البيانات في العالم. وبحسب التقرير السنوي -Short et al. (2011: 7) J‏ كم $& 
ا معلومات؟ - عالجت خادمات العام للعام ١٠٠م,‏ 9.57 زيتابايت من المعلومات... وكان 
هذا معدل Y‏ غيغابايت من ال معلومات يوميا للعامل العاديء أو نحو Y‏ تيرابايتات من 
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المعلومات لكل عامل سنوياً. وقامت الشركات في العام بمعالجة W‏ تيرابايتاً من المعلومات 
lisi a‏ باستثناء اللصادر غير المحوسبة» وبحلول عام ۲۰۱۰ ie‏ قدّرت مؤسسة om pl‏ آي 
(MGI)‏ (بحسب ما ذكر 3 :2011 ob (Manyika etal.‏ الشركات Ule‏ قد قامت بتخزين 
أكثر من V‏ إكسابايت من البيانات الجديدة على الأقراص الصلبة ... في حين قام المستهلكون 
بتخزين أكثر من 7 إكسابايتات من البيانات الجديدة على أجهزة من قبيل أجهزة الحاسب 
الشخصية وأجهزة الحاسب المحمولة. كما 19,38 كذلك أنه في «e ۲۰۰۹ ele»‏ كان ما يقرب 
من كل القطاعات في الاقتصاد الأمريكي لا يقل بياناتها ا مخزنة بالمتوسط عن 7٠١‏ تيرابايت 
من البيانات لكل شركة فيها أكثر من ألف موظف. كما امتلكت العديد من القطاعات أكثر 
من 1 بيتابايت من البيانات اممخزنة لكل شركة». وفي e ٠١١1 ele‏ أشار Neelie Kroes‏ 
مفوض الاتحاد الأوروبي لجدول الأعمال الرقميء بأن VV‏ مليون بليون بايت من البيانات 
يجري توليدها في الدقيقة الواحدة على مستوى العام )2013 (Rial‏ 


وبناء على مراجعة )2011( Manyika et al.‏ لنمو حجم البيانات» فقد توقعوا 
ارتفاعا بنسبة ٠‏ في GUI‏ في نمو البيانات التي يتم إنشاؤها على مستوى العام batu‏ 
وقذر )2011( ob Gantz and Reinsel‏ «كمية المعلومات التي e‏ إنشاؤها وإعادة 
نسخها (تكرارها) على الإنترنت ستتجاوز ۱,۸ زيتابايت 54b 5 VA)‏ غيغابايت) à‏ 
العام ۲١٠١‏ مخزنة في ٠٠١‏ كوادريليون (مليون مليار) ملف بيانات». ويبين هذا الذي 
ذكروه 0 مقدار تسعة أضعاف خلال خمس سنوات فقط مع نمو متوقع في ذات 
الوقت إلى أكثر من الضعف كل سنتين. ونتيجة لذلكء فقد توقعوا في تقريرهم بأنه في 
العقد التالي: 

سيزداد عدد الخوادم (الافتراضية والفيزيائية) في جميع أنحاء العام بعشرة أضعاف. 
في حين à TE REEE‏ مراك col‏ الشركات ck EE‏ فعا 
وسيزداد أعداد املفات التي سوف تضطر مراكز البيانات إلى التعامل معها بمقدار ahs‏ 
على الأقل. 

وبمثل هذا النمو الهائل في إنتاج البيانات» ادعت شركة آي بي IBM (2012) el‏ 
بأن Z3»‏ من البيانات في العام اليوم قد تمّ إنشاؤها في العاميين الماضيين فقط» 
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كما توقع )2012( Zikopoulos et al.‏ أن تقارب أحجام البيانات YO i>‏ زيتابايت 
بحلول عام gY*Y*‏ 

ويمكننا إدراك وقوع هذا الانفجار في إنتاج البيانات الرقمية من خلال النظر في بعض 
الأمثلة المحددة. فشركة تك أمريكا (TechAmerica)‏ قدرت ab‏ يجري (Nom‏ إرسال ما 
يقرب من 114 مليار رسالة بريد إلكترونية و٤٠‏ مليار رسالة نصية» كما يتم إجراء W‏ مليار 
مكالمة هاتفية على مستوى العام )2013 (Strohm and Homan‏ 555( لشركة سيسكو 
(CISCO)‏ ففي العام "١17‏ م کان هنالك Lar‏ ما يناهو Cuba V‏ عتضر (أجهزة اتضال 
ومستشعرات) مشكلة شبكة إنترنت الأشياء «(Internet of Things -IoT)‏ والتي يقوم كل 
منها بإنتاج كميات متغيرة من البيانات» مع الزيادة المتوقعة لهذا الرقم ليفوق الخمسين 
ملياراً بحلول عام ۲۰۲۰ م )2013 .(Farber‏ أما ما يتعلق بحركة الاتصال على الإنترنت. 
فقد كانت شركة جوجل تعالج Y‏ مليارات طلب استعلام للبحث dogs‏ وتقوم بتخزينها 
(Mayer-Schonberger and Cukier 2013) sas‏ وقرابة YE‏ بيتابايت من البيانات 
کل يوم )2012 às (Davenport et al.‏ العام TARAR)‏ قضى المستخدمون النشطون 
ggh‏ التواصل الاجتماعي فيسبوك jS]‏ من ٩,۳‏ مليارات ساعة خلال شهر Manyika et)‏ 
(al. 1‏ وبحلول ele‏ ۲۰۱۲ م» ذكرت الشركة بأنها كانت تعالج ۲,۵ مليار من مختلف 
أنواع بيانات المحتوى (وصلات» مخازن» ose‏ أخبار وما إلى ذلك) و/ا,؟ la‏ من ردود 
الإعجاب SLEG‏ مليون عملية تحميل للصور .(Constine 2012) Eat‏ كما تم إنتاج 
أكثر من أربعمائة مليون 53 $25 e‏ في العام Y: W‏ > معدل زيادة مقداره مئتان 
في dius al‏ مع احتواء JS‏ 35 825 على 536 4 ass‏ دا من البيانات الوصفية 
لها )2013 .(Mayer-Schonberger and Cukier‏ و الكثير من هذه البيانات غير 
منظمة بطبيعتها. وبالمثل هنالك انفجار في حجم إنتاج البيانات المنظمة قد وقع أيضاء على 
سبيل JELI‏ وفيما يتعلق ببيانات تجارة التجزئة الخاصة بالأوراق المالية والمبيعات» والتي تم 
جمعها من خلال السلاسل السوقية (اللوجستية) ومنافذ البيع» أنتجت سلسلة متاجر وول 
مارت (Walmart)‏ أكثر من ۲,١‏ بيتابايت من البيانات المتعلقة بأكثر من مليون عملية خاصة 
بالعملاء في كل ساعة في العام «eY* Y‏ «أي يفوق ما يعادل VIV‏ مرة من المعلومات الواردة 
في جميع الكتب المصنفة في مكتبة الكونغرس»؛ 6 :2012 (Open Data Center Alliance‏ 
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كما أنتجت متاجر تسكو (Tesco)‏ البريطانية أكثر من VO‏ مليار m‏ جديداً من بنود البيانات 
JS‏ شهر في العام ۱م )2011 .(Manyika et al.‏ 


وبا لمثلء تنتج الحكومات والهيثات العامة كميات هائلة من البيانات حول مواطنيها 
والدول الأخرى. على سبيل colo JELI‏ هيئات التنقل والعبور في مراقبة التدفق المستمر 
للناس من خلال أنظمة النقلء على سبيل «JUL‏ جمع زمن ومكان استخدام بطاقات السفر 
مسبقة الدفع مثل بطاقة أويستر في لندن. كما يجري الآن تقديم العديد من نماذج وطرق دفع 
الضرائب أو طلبات الحصول على الخدمات الحكومية من خلال الانترنت» ففي العام 2009« 
أنتجت حكومة الولايات المتحدة AEA‏ بيتابايت من البيانات (مؤسسة التقنية الأمريكية 
.(TechAmerica Foundation 2012‏ كما تعمل وكالات الاستخبارات الست عشرة التي 
تشكل أمن الولايات المتحدة, جنباً إلى جنب مع فروع الجيش الأمرييء على مراقبة وتخزين 
وتحليل كميات هائلة من البيانات كل ساعة. من خلال آلاف ال محللين العاملين في تدقيق 
وتفسير النتائج. وللحصول على فكرة عن حجم بعض مشاريع الاستخبارات العسكرية» فإن 
مشروع النظام المستقل للمراقبة الأرضية الصورية الحقيقية (ARGUS-IS)‏ والذي كشفت 
عنه وكالة مشاريع البحوث المتطورة الدفاعية (داربا (DARPA‏ وجيش الولايات المتحدة في 
العام ce ۲١٠١‏ هو منصة للمراقبة بالفيديو بدقة VA‏ غيغابايت والتي ممكنها بيان التفاصيل 
الصغيرة حتى ست بوصات من ارتفاع ٠٠٠٠١‏ قدم (ستة كيلومترات) )2013 (Anthony‏ 
VA d‏ مليار بکسل» ١١ à‏ إطاراً في الثانية ( لقطة في الثانية > مما ينتج ما يقارب 

٠‏ غيغابت في الثانية. وهذا يعادل نحو بيتابايتات من البيانات يوميا. وباستخدام 
الحاسوب العملاق» يمكن للنظام ele‏ لفطل Gl‏ من خلال تتبّع ما يصل إلى 10 جسما 
ET‏ ضمن مجال الرؤية. وهذا هو مشروع واحد فقط في ترسانة المشاريع الاستخباراتية 
BU LI‏ وذات الصلة. 

وبالمثل» فيما يتعلق بالمشاريع العلمية» يتكون تسلسل الجينوم البشري من نحو ٠٠١‏ 
غيغابايت من البيانات )2012 :(Vanacek‏ وهذا يتضاعف عبر الآلاف من الأفراد مما 
يوسع قاعدة البيانات قريباً إلى تيرابايت وبيتابايت من البيانات. وعندما بدأ التشغيل 
في مسح سلوان الجوي الرقمي (Sloan Digital Sky Survey)‏ في العام 5٠٠١‏ أنتج 
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المرقاب (التلسكوب) في نيومكسيكو من بيانات الرصد وامراقبة في أول شهرين أكثر مما 
سبق جمعه في تاريخ ele‏ الفلك حتى ذلك الوقت )2010 (Cukier‏ وفي عام ۲۰٠۱۰‏ م 
بلغ حجم أرشيفها ما يقارب ٠٤٠١‏ تيرابايت من البيانات» وهي كمية سيتم قريباً جمعها 
كل خمسة أيام من قبل المرقاب الكبير للمسح الشامل Large Synoptic Survey)‏ 
(Telescope‏ والذي بيدا العمل به في شيلي في العام 2016 .(Cukier 2010)e‏ وأكثر 
ضخامة من هذا مصادم هادرون الكبير (Large Hadron Collider)‏ والذي يقوم بإنتاج 
٠‏ تيرابايت من البيانات في الثانية الواحدة )2010 Economist,‏ عط1). وقي dis‏ 
وغيره من الحالات» يتم إنشاء بيانات هائلة للغاية لا o Sae‏ تحليلها أو تخزينهاء بحيث 
تعد بيانات عابرة. وق الواقع» لا وجود لهذه القدرة التخزينية لكل هذه البيانات. فعلى 
الرغم من التوسع السريع في القدرات التخزينية» إلا أن هذا التوسع لا يمكنه مواكبة إنتاج 
البيانات )2011 (Gantz et al. 2007; Manyika et al.‏ 


الشمول :(Exhaustivity)‏ 
تستخدم عملية انتقاء العينات في دراسات البيانات الصغيرة من أجل إنتاج مجموعة 
بيانية تمثيلية لمجتمع الدراسة من جميع البيانات المحتملة في وقت معين ومكان معين. 
وتستخدم عملية انتقاء العينات من مجتمع الدراسة بسبب كبر هذا المجتمع وتعذر gaz‏ 
كافة البيانات المتعلقة به محدودية الوقت واموارد المخصصة. في المقابل» تسعى مشاريع 
البيانات الكبيرة إلى التقاط بيانات كامل مجتمع الدراسة (ن = (JIII‏ أو على الأقل» حجم 
عينة أكبر من المعتادة في دراسات البيانات الصغيرة Mayer-Schonberger and Cukier)‏ 
3. فمن ناحيةء تعد هذه البيانات نتاجاً ثانوياً للتقنيات التي استخدمت في إنتاج 
oC‏ جتنا إلى جنب مع النمو الهائل في القدرة على تخزين البيانات (انظر الفصل 
الخامس)» ومن ناحية أخرىء هناك قناعة بأن "الأكثر هو أفضل" وسيقدم بقل ]45 13:349 

من الدقة والصحة في التحليل. 

وفي النظم المفتوحة مثل المشاريع العلمية الكبيرة. كتلك التي تقيس البيانات المناخية 
للإبلاغ عن الطقس ونمذجة الأرصاد الجوية» أو جمع البيانات الفلكية باستخدام مرقاب 
قويء يكون التوجه نحو مجموعات بيانات أكبر بكثير مع زيادة أحجام العينات عبر العديد 
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من المتغيرات ما أمكن ذلك. ولا يعني ذلك في علم الفلك. على سبيل اللثالء مجرد gaz‏ 


بيانات «s aJ]‏ ولكن أيضا البيانات من مختلف ألوان الطيف الكهرومغناطيسيء وبدقة 
عالية لأكبر قدر ممكن. أما في حالة النظم المغلقة. مثل الفيسبوك أو شراء السلع من 
متجر على شبكة الإنترنت مثل أمازون أو إرسال رسائل البريد الإلكتروني» فمن ال ممكن 
تسجيل كافة التفاعلات والعمليات التي تحدث» بالإضافة إلى مستوى عدم التفاعل. وفي 
هذه الحالات» هذا هو الواقع بطبيعة الحالء فموقع التواصل الاجتماعي الفيسبوك يقوم 
بتسجيل كل نشرء أو سجيل "ole‏ أو رفع لصورة يتم تحميلهاء أو وصلة إلى موقع آخرء 
أو رسالة مباشرةء أو لعبة لعبت» أو فترات الغياب» وما إلى ذلك لكل مستخدميه الذين 
ناهزوا المليار أو نحو ذلك. وبامثل, لا تسجّل شركة الأمازون فقط تفاصيل كل عملية شراء 
واطمشترين» ولكن أيضاً جميع الروابط التي تم زيارتها وكل السلع التي تم استعراضها من 
خلال موقعهاء بالإضافة إلى كافة البنود التي تم وضعها في سلة التسوق وم يتم شراؤها. 
كما يتم تسجيل كافة رسائل البريد الإلكتروني من قبل الخادمات التي تستضيف صندوق 
البريد الإلكتروني للعميل. وتخزين كامل البريد الإلكتروني وجميع البيانات الوصفية المرتبطة 
به على سبيل المثال» الذين تم إرسال البريد الإلكتروني لهم أو استلامه منهم» والوقت / 
التاريخ» والموضوع. والملفات المرفقة. وحتى لو تم تحميل البريد الإلكتروني محلياً على جهاز 
المستخدم وتم حذفه فما زالت نسخة محفوظة منه على الخادم» هذا مع احتفاظ معظم 
المؤسسات والشركات بهذه البيانات لعدد من السنوات. 

وبالمثل بالنسبة للأشكال الأخرى من البيانات» فقد نمت البيانات المكانية بشكل كبير في 
السنوات الأخيرةء وذلك من خلال الاستشعار الآني عن بعد والصور الرادارية» إلى المشاريع 
الكبيرة مكتظة ا مصادر مثل مشروع خرائط الشوارع المفتوحة (OpenStreetMap)‏ 
والمسارات المكانية الرقمية التي تم إنشاؤها بواسطة مستقبلات أنظمة تحديد المواقع 
الجغرافية المضمّنة داخل الأجهزة. ويهدف الصنفان الأوّلان إلى أن يكونا شاملين مكانياء 
بحيث تجمع التضاريس للكوكب الأرضي بأسره» ورسم خرائط البنية التحتية لدول بأكملها 
وتوفير مجموعات بيانات مشتركة das yas‏ للخرائط. في حين يوفر المشروع الثالث القدرة 
على تتبّع وتعقب الحركة عبر الفضاء بمرور الوقت؛ وبناء مسارات الزمن - الفضاء التي يمكن 
تجميعها لتوفير نماذج الزمن - الفضاء للسلوك عبر مدن ومناطق بأكملها. وتمكن مجتمعة 


wt‏ ثورة البيانات البيانات الكبيرة» والبيانات المفتوحة» والبنى التحتية للبيانات» والنتائج المترتبة عنها 


البيانات الكبيرة 


من النمذجة ال مفصّلة للأماكن وطرق التنقلء والمقارنة المسحية عبر الفضاء. واستهداف 
التسويق لمجتمعات duszo‏ وتقديم خدمات جديدة معتمدة على dobl‏ والبيانات التي 
هكن الجمع بينها لاشتراكها في المرجعيات المكانية لإنشاء قواعد بيانات وتطبيقات جديدة 
من Lala ca el‏ فبا ule)‏ سبيل JUL‏ جمع البيانات حول منطقة إت اء ملقات 
ريف gu‏ 


وبالنظر إلى التقدم الحاصل في سعات التخزين (انظر الفصل الخامس)» يبدو أننا قد وصلنا 
إلى مرحلة بحيث يكون من الأسهل في كثير من الحالات تسجيل كل «e$‏ دون الحاجة إلى فرز 
البيانات» وتدقيقهاء وأخذ عينات منهاء وتسجيل ما يحتمل أنه مفيد منها فقط (ومن الذي 
يعرف ما يثبت احتمال أنه مفيد في ا لمستقبل؟). وكما أشار )2012( Y» :Zikopoulos et al.‏ 
عجب Ul‏ نغرق في البيانات» فإذا كنا نستطيع تتبع وتسجيل شيء ماء فإننا بالعادة نفعل». 
وفي الواقع» أشار )7 :2012( Dumbill‏ إلى أن المبدأ الأماسي خلف البيانات الكبيرة هو «عندما 
تستطيع, احتفظ بكل شيء». ويتجلى هذا بالاعتقاد بأنه كلما كان المزيد من البيانات dera‏ 
سنحت فرص أفضل لصنع رؤية أكثر صحة ونفاذا... وفرص العثور على «المنتجين» لنظرية 
جديدة John Seely Brown)‏ مقتبس من 8 :2010 Bollier‏ ). وعلى e£ JI‏ من «US‏ تسهم 
إستراتيجية السعي نحو الشمولية بشكل كبير في طوفان البيانات» ويتمثل التحدي الأكبر في 
رؤية النمط الشامل والصورة الكبيرة من جملة التفاصيل وتمييز الغث من السمينء وإثارة 
مجموعة من الأسئلة الأخلاقية فيما يتعلق بنطاق البيانات التي يتم إنتاجها والاحتفاظ بهاء 
والاستخدامات التي يجري توظيفها فيها أو من Sce‏ توظيفها فيها (انظر الفصل العاشر). كما 
أنها تثير تساؤلات معرفية أساسية )2012 1101101). على سبيل JELI‏ وبالنظر إلى شموليتهاء 
تساءل )2012( Callebaut‏ عما إذا كانت تحليلات البيانات الكبيرة هي علم ما بعد الاختزال 
(Post-reductivist)‏ وسيتم مناقشة هذه الأسئلة مزيد من التفصيل في الفصل الثامن. 


الدقة والتبويب/ الفهرسة :(Resolution and Indexicality)‏ 
بالإضافة ss s]‏ البيانات: أصبحت البياناث الكبيرة Las AST‏ ف الدقة بك 
وهاتان الخاصيتان يدفعان جميعاً في الاتجاه نحو التبويب/ الفهرسة القوية (عنونة 
بوسم مميز وتحديد للهوية) )2005 (Dodge and Kitchin‏ وتعد صور الاستشعار 
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عن بُعد مثالا على تعزيز الدقة, ففي أواخر الثمانينيات كانت أعلى دقة للصور المتاحة 
معظم الباحثين غير الحكوميين عن سطح الأرض هي لتلك الصور التي التقطتها أقمار 
لاندسات (Landsat Satellites)‏ الصناعية. حيث تمثل كل نقطة ضوئية (بكسل) قطعة 
فسن الأرض 125 da Y* x Y* J4‏ في حين أن الكثير من الصور المتاحة على جوجل إيرث 
ذات 85 à‏ تصل إلى 75,0 x‏ ۲,۵ مترء مما يتيح عرض امزيد من التفاصيل وتحليلها. 
وبا مثلء فيما يتعلق بمخرجات بيانات التعداد السكانيء فقد زاد علو درجة البيانات 
في العديد من الدول. ففي الحالة الأيرلندية» كان نشر بيانات التعداد حتى وقت 
قريب للدوائر الانتخابية ) ٠,205‏ منطقة بمتوسط ٠,١١١‏ نسمة في كل dais‏ حيث 
كانت الكثافة السكانية لكل دائرة انتخابية أعلى بكثير في oahl‏ والبلدات وأقل في 
المناطق الريفية). وف العام ۲١٠١‏ تم وضع بيانات التعداد بتوزيع جغرافي جديد سمي 
بالتجمعات الصغيرةء التي بلغ عددها AAEM‏ تمثل الوحدات الجديدة بالعادة بيانات من 
۱0۰-۰ من الأسر )2009 .(Gleeson et al.‏ وقد أتاحت التجمعات الصغيرة إجراء تحليل 
التعداد على مستوى الحي أو الشارع بدلا من مساحات شاسعة das‏ ومناطق دات 
sl uelis)‏ قرا من السكان التي کا سما يد ر ا ا ا 
السكانية والاقتصاد الأيرلندي. واا في تحري المزيد من ABI‏ يجمع العديد من 
وكلاء / سماسرة البيانات كميات كبيرة من البيانات المتعلقة بالأفراد والأسر التي تمكن 
الشركات من استهدافهم بشكل فردي بالسلع والخدمات (انظر الفصل الثاني). 
وقد صاحبت الزيادة في دقة البيانات» الزيادة في تحديد الهويات للأشخاص. واممنتجات» 
والمعاملات. والأقاليم عدي sel‏ ااا أكثر d usas Ls‏ خو انط Jea‏ 
الخامس). فعلى سبيل JELI‏ تحمل معظم السلع ا معروضة للبيع في متاجر التجزئة الكبرى 
في الوقت الحاضر الرمز الشريطي (الباركود)» ويميّز هذا الرمز المنتج» ولكن ليس كل وحدة 
منه على حدة - حيث تشترك كل زجاجات صابون شعر الرأس (الشامبو) من نفس العلامة 
التجارية (الماركة) في نفس الرمز - مما يعني أنه لا يمكن التمييز بينها بشكل فردي. 
ds‏ المقابلء تتميز زجاجة صابون شعر الرأس الموسومة بشريحة تحديد الهوية باستخدام 
موجات الراديو (Radio Frequency Identification Device- RFID)‏ بشكل فريد. 
OS‏ لكل شريحة رمز فريد من الممكن قراءته عن بعد بواسطة جهاز استشعار الذبذبات 
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الراديوي. ونتيجة لذلك» يمكن تتبع كل زجاجة من مكان صنعها من خلال سلسلة التوريد 
وحتى المتجر وسلة العميلء مما يوجد مسار للتدقيق المفصل. وبعبارة أخرىء فقد أصبح 
من الممكن تتبّع الأمور الفردية بدقة عبر الزمان Le Oly‏ في ذلك أولئك الذين يعملون 
على نقل أشياء من مكان لآخر. وبالمثل: بالنسبة للمعلومات» وخاصة تلك التي في شكل 
رقميء حيث يتم تعريفها بشكل فريد من خلال رموز إدارة الحقوق الرقمية Digital)‏ 
(Rights Management‏ فعلى سبيل «JULI‏ يمكن تعيين معرفات الكائن الرقمي Digital)‏ 
(Object Identifiers- 8‏ إلى الأعمال الإبداعية المتوفرة على الإنترنت (كالتقاريرء 
المجلات» الصورء الصوت. وملفات الفيديو). فمعرفات الكائن الرقمي هي محدد هوية دائم 
مرتبط بالبيانات الوصفية« مثل عنوان الإنترنت (Universal Resource Locator- URL)‏ 
الذي يشير إلى موقع الملف. ويعرّز استخدام المعرّفات الفريدة العلائقية والقدرة على ربط 
وضم البيانات معاء كما يوفر وسائل عملية لفرز ورصد ومطابقة وتمثيل الكائنات Lyon)‏ 
:2003a; Dodge and Kitchin 2005; Graham 2005‏ انظر أيضا الفصل العاشر). 


العلائقية :(Relationality)‏ 
تتمثل العلائقية بمدى القدرة على ضم مجموعات بيانات مختلفة بروابط بعضها مع 
بعض وكيف يمكن استخدام هذه الروابط للإجابة عن أسئلة جديدة. فالعلائقية هي 
في صميم قواعد البيانات العلائقية (انظر الفصلين الثاني والخامس»). وهي القدرة على 
إنشاء بيانات غاية في العلائقية التي تدفع بسوق البيانات الواسع وأرباح وكلاء البيانات 
وشركات الملفات التعريفية (انظر الفصل الثاني). إن الدرجة العالية من العلائقية هي 
ما نجل aliae‏ النسكان eid e La aa‏ ارك Lal ali‏ لأي أمق وكف فض عير 
الزمان والمكان. وتختلف دراسات البيانات الصغيرة في مدى علائقيتهاء أي ميل تلك التي 
تنطوي على البيانات ا منظمة لدرجات uel‏ من الترابط من تلك البيانات غير المنظمة, 
وهذا يستدعي القول إنه ينبغي وجود شكل من أشكال العلائقية بين البيانات لاستخلاص 

التفسيرات والاستنتاجات الشاملة منها. 
وعلى الرغم من أن البيانات الكبيرة لا تستخدم غالبا بنية قاعدة بيانات علائقية 
Bal)‏ الفصل الخامس)»ء فإن ميزة أساسية في طبيعتها هي العلائقية القوية. وكما La‏ 
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boyd and Crawford (2011: 2)‏ فإن «البيانات الكبيرة مترابطة بشكل أساسيء وتنبع 
قيمتها من الأنماط التي يمكن استخلاصها من خلال guo‏ روابط بين أجزاء من البياناتء 
عن فرد» أو أفراد على علاقة بآخرينء أو مجموعات من الناس» أو ببساطة عن هيكل 
تنظيم المعلومات نفسها». إلا أنها وخلافاً لقواعد البيانات العلائقية. فهي تتقن بالتساوي 
التعامل مع البيانات غير الرقمية (الرمزية)» والبيانات غير المنظمة كما البيانات المنظمة 
والربط بين النوعين معا وتعظيم القيمة المستفادة من التقاطعات بينها. ومن ثم, أصبح 
من الممكن Jas JI‏ بين مجموعات متنوعة من البيانات - الشخصية. والعملية: والتفاعلية, 
والاجتماعية:. والمالية» والمكانية» والزمنية» eJ]...‏ - وتحليلها على أساس فردي وجماعي 
للعلاقات والأماط. 

وقد ثبت جلياء كمثال على قوة هذه العلائقية, الاستخدام المكثف للبيانات الكبيرة في 
الحملات الانتخابية للرئيس الأمريكي أوباما في العام ۸٠۲۰م‏ و117١7م.‏ فعلى النحو الذي 
فصّله )2012( TIssenberg‏ سعى فريق أوباما لتحديد وتتبع جميع جوانب حملاتهم 
الانتخابية في ٠٠١8‏ م و١٠١۲ «e‏ ووضع سلسلة كاملة من المقاييس التي تم تسجيلها 
والتنقيب فيها بشكل مستمر للحصول على معلومات» وأنماط واتجاهات مفيدة. واشتمل 
ذلك على مراقبة صارمة للإجراءات الخاصة بهم» مثل وضع الإعلانات عبر وسائل الإعلام 
المختلفة» وإجراء حملات بريد الإلكترونية. والاتصال الهاتفي بالناخبين المحتملين» وطرق 
الأبواب وفرز الاصوات الانتخابية للمناطق» وتنظيم الاجتماعات والمسيرات» وتتبع الذين 
كانوا قد تحدثوا إليهم وماذا قالوا أو ما التزموا به. وقد عززوا هذه المعلومات هئات 
التجارب العشوائية واسعة النطاق المصمّمة لاختبار فعالية مختلف طرق إقناع الناس على 
التصويت لصالح أوباما أو التبرع بالأموال لحملته. وجمع فريق أوباما بين جميع ا معلومات 
التي نتجت فيما تعلق بالناخبين وبيانات التسجيلء والتعداد GLI‏ والبيانات الحكومية 
I‏ 5,5« ومسوحات الاقتراع» وبيانات جرى شراؤها من طيف واسع من الموردين, ما في 
ذلك وسطء البيانات ووكالات التصنيف الائتماني» وشركات التلفاز الخطي (Cable TV)‏ 
وكانت النتيجة مجموعة من قواعد البيانات الضخمة عن كل الناخبين في البلاد تتكون مما 
لا يقل عن ثمانين من المتغيرات )2012 (Crovitz‏ وأكثر من ذلك أنها ترتبط بالخصائص 
الدهموغرافية للناخبين المحتملينء وتاريخ انتخابهم» وكل حالة من حالات تواصلهم مع 
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حملة أوباما وردود أفعالهم» والتاريخ الاجتماعي والاقتصاديء وأنماط سلوكهم واستهلاكهم, 
ووجهات النظر والآراء التي تم الإعراب عنهاء مع تحديث قواعد البيانات يومياً خلال 
الحملة بكل بيانات جديدة يجري إنتاجها أو شراؤها. إما في الحالات التي لا يعرف فيها 
محللو أوباما الانتماء السياسي للناخب» ولا يمكنهم فيها الوصول إلى ذلك من خلال الاتصال 
المباشر معه» فإنهم يوظفون خوارزمية متطورة تستخدم المتغيرات التي بحوزتهم عن 
شخص ما للتنبؤ عن التصويت المحتمل المفضل له )2012 .(Issenberg‏ وكانت النتيجة 
مليارات من أجزاء البيانات المترابطة والتي استخدمت للتعريف بالناخبين بشكل $253« 
وتقييم مدى احتمالية قيامهم بالتصويت والكيفية التي يصوتون بهاء والكيفية التي قد 
يستجيبون بها مختلف السياسات والقصص. لقد أنشاً الترابط بين البيانات في حملة 
أوباما ما اصطلح عليه )2012 (Crampton et al.‏ مصطلح «تأثير تضخيم ال معلومات» 
(Information Aplifier Effect)‏ حيث مجموع البيانات أكثر من الأجزاء. 


السرعة :(Velocity)‏ 
هناك فرق جوهري بين البيانات الصغيرة والبيانات الكبيرة يتمثل في الطبيعة الديناميكية 
لإنتاج البيانات» فالبيانات الصغيرة تتكوّن عادة من الدراسات التي تكون مؤطرة بقالب 
جامد من حيث الزمان والمكان. وحتى في الدراسات المطؤلة» يتم التقاط البيانات في أوقات 
متفرقة ذات فاصل زمني (على سبيل JS «JUL‏ بضعة أشهر أو سنوات). فعلى سبيل «JULI‏ 
يتم إجراء التعدادات السكانية بشكل عام كل خمس أو عشر سنوات» وف المقابل يتم 
إنشاء البيانات الكبيرة على أسس أكثر استمرارية بكثير» وفي كثير من الحالات بشكل آني أو 
لحظي وبشكل مباشر بالتقارب من الوقت الحقيقي للوقوع (Real-Time)‏ . وعوضاً عن 
قدر ضئيل ومتفرق من البيانات» التي تجمع أو تعالج بمشقة: فإن البيانات الكبيرة تتدفق 
بسرعة» ولذلك كان هناك انتقال في التعامل من المعالجة بالدفعات (Batch processing)‏ 
إلى البيانات المتدفقة )2012 .(Streaming Data) (Zikopoulos et al.‏ فمن dam‏ 
يسهم هذا في مسألة كبر حجم البيانات من خلال إنتاج بيانات بسرعة أكبرء ومن ناحية 
أخرىء فهو يجعل كامل دورة البيانات أكثر ديناميكية بكثير ويبرز قضايا كيفية إدارة نظام 

البيانات المتغير باستمرار. 
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وتنبع السرعة من التكرار المستمر لتسجيل ال مشاهدات مع مرور الوقت و/أو تغيّر 
المكان )2009 (Jacobs‏ مع كون العديد من الأنظمة في وضع التشغيل الدائم باستمرار 
(Dodge and Kitchin 2005)‏ فعلى سبيل «JULI‏ تسجل امواقع الإلكترونية بيانات كافة 
الزيارات التي تمت للموقع والأنشطة التي قام بها الزائر خلال تصفحه على الموقع؛ كما 
تقوم المعدات الطبية بمراقبة العلامات الحيوية باستمرارء وتسجل الكيفية التي يستجيب 
بها الجسم للعلاج وتطلق إنذاراً في حال تجاوزت هذه العلامات حدّ معين؛ وتتعقب شركات 
الهاتف ا محمول موقع» digag‏ وطبيعة استخدام الأجهزة ا موصولة على شبكاتها كل بضع 
ثوان؛ وبالمثل ترصد شبكات استشعار الطقس مؤشرات الغلاف الجوي كل بضع دقائق 
وترسل نتائجها إلى قاعدة بيانات مركزية لإدراجها في الاستطلاعات الجوية؛ ويسجل جهاز 
استشعار الذبذبات الراديوي (Transponder)‏ على طول طرق المدينة البرية والسكك 
الحديدية هوية الحافلات والقطارات التي Gë‏ مما يتيح لسلطة النقل العام معرفة أماكن 
مركباتها في أي وقت» واحتساب الوقت المقدّر للوصول في محطات التوقف المختلفة؛ كما 
تراقب متاجر التجزئة مبيعات آلاف المنتجات المختلفة للآلاف من العملاءء حيث تستخدم 
البيانات لمعرفة أوقات إعادة تعبئة الرفوف وطلب دفعات جديدة من الموردين؛ ويتواصل 
الناس بعضهم مع بعض من خلال مواقع وسائل التواصل الاجتماعي في سيل لا ينتهي 
من التبادلات والعلاقات البينية المتشابكة؛ ويرصد المرقاب (Telescope)‏ باستمرار السماء 
لقياس التقلبات في موجات الراديو من أجل فهم أفضل لطبيعة الكونء ففي JS‏ هذه 
«Syl‏ هناك تيار مستمر من البيانات التي تتطلب إدارة وتحليلا مستمرا. 

ويشكل نقل وإدارة كميات كبيرة من البيانات المنتجة باستمرار bass‏ تقنياً بسبب 
التحديات الناشئة عن محدودية قدرة سعة التخزين مما يوجد اختناقات بشكل سريع 
في حركة مرور وتبادل البيانات. على سبيل المثال» وكما أن فيديوهات موقع اليوتيوب 
(YouTube)‏ قد تتوقف أو يتأخر عرضها بسبب كون سعة قناة الاتصال بالإنترنت ليست 
كافية لتواكب سرعة تدفق البيانات ال مطلوبء فإن الأثر نفسه هكن أن يقع في حالة جمع 
ومعالجة البيانات» حيث تكون الأنظمة عاجزة عن مواكبة تدفق البيانات. وتشمل حلول 
هذه ا مشكلة زيادة سعة قناة الاتصال» وتوظيف تقنيات فرز وضغط البيانات مما يقلل 
من حجمها ومن ثم وقت معالجتهاء وتحسين كفاءة خوارزميات ال معالجة وتقنيات إدارة 
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البيانات. كما Jig‏ تحليل سيل البيانات المتدفقة تحدياً أيضاًء ON‏ النظام لا يسكن في أي 
لحظة aues‏ أي dhis‏ كما في حالات الأسواق iU‏ حيث هكن أن يكون تحليل الصفقات 
s Sold‏ ثانية من الزمن قيّماً للغاية. duas‏ تستخدم خوارزميات معقّدة. إلى جانب العرض 
à Al‏ للبيانات الديناميكية وهي à‏ حالة تغير مستمرء لتتبع وتقييم النظام. 


التنوع :(Variety)‏ 
قد تختلف البيانات الصغيرة والبيانات الكبيرة في طبيعتهاء كونها منظمة» أو غير منظمة, 
أو شبه منظمة» وتتألف من الأرقام, «essa‏ الصورء الفيديوء وغيرها من أنواع البيانات 
الأخرى. إلا أن هذه الأنواع المختلفة من البيانات يرجح أن تكون في البيانات الكبيرة أكثر 
قابلية للجمع والربط بينهاء وإمكانية وصل البيانات المنظمة بالبيانات غير ا منظمة. فعلى 
سبيل المثال» تتألف نشرات الفيسبوك من النصوص التي ترتبط في الغالب بصور أو ملفات 
فيديو أو غيرها من المواقع» وهي تجتذب تعليقات مستخدمي الفيسبوك الآخرين؛ كما 
قد تجمع شركة ما بين البيانات المالية المتعلقة بالمبيعات واستطلاعات العملاء التي تعبّر 
عن مدى ثقتهم بالمنتج» وفي المقابل تكون البيانات الصغيرة أكثر انفصالاً وترتبط» على 
كل حالء من خلال مفاتيح تعريفية وحقول بيانات مشتركة. ويتمثل السبق الأساسي 
بالنسبة للبيانات الكبيرة في كيفية اختلافها عن الأشكال التي سبقتها لإدارة البيانات الرقمية, 
والتي كانت احترافية للغاية في معالجة وتخزين البيانات الرقمية باستخدام قواعد البيانات 
العلائقيةء مما مكن من إجراء مختلف أنواع التحليل الإحصاي. إلا أنها كانت أضعف بكثير 
في التعامل مع نماذج البيانات الغير رقمية» عدا عن مجرد تخزينها في ملفات مجردّة أو 
مضغوطة. وكما لاحظ اتحاد مراكز البيانات المفتوحة )7 :2012( Data Center Alliance‏ 
بأنه في السابق كان يجري تجاهل البيانات غير المنظمة» أو في أحسن الأحوالء استخدامها 
بشكل يفتقر إلى الكفاءة. ومع US‏ فإن التقدم الحاصل في الحوسبة الموزعة. وتصميم 
قواعد البيانات باستخدام هياكل عوضاً عن لغات الاستعلام الهيكلية (NoSQL)‏ (انظر 
الفصل الخامس». والتنقيب في البيانات وتقنيات اكتشاف المعرفة (انظر الفصل السادس)» 
قد زادت بشكل كبير القدرة على إدارة ومعالجة واستخراج ال معلومات من البيانات غير 
ا منظمة. وف الواقع» يجري على نطاق واسع تداول أن ما يقارب ثمانين في المائة من جميع 
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البيانات الكبيرة هي غير منظمة بطبيعتها. وكما أبان )2011( (Grimes‏ فقد أصبح هذا 
الرقم مسلّماً به مع قليل من الإثبات. 


المرونة :(Flexibility)‏ 
يكون تصميم البحث وإدارة البيانات» مع مشاريع البيانات الصغيرة» غير مرن نسبياً 
بمجرد بدء العمل الميداني والتحليلء وذلك بالنظر إلى الخدمات اللوجستية» والتكاليف» 
والحاجة إلى التمثيل في عينة صغيرة الحجم. فعلى سبيل «JULI‏ فإنه من الضروري على كل 
شخص $3 جمع بيانات التعداد له تعبئة النموذج ذاته للتأكد من إمكانية قابلية مقارنة 
البيانات عبر كافة السكان. وبمجرد طباعة النماذج, لا هكن إضافة حقول بيانات جديدة, 
مما يعني ثبات البيانات الممكن استخراجها من هذه النماذج» وبا مثل تميل قواعد البيانات 
العلائقية التي تحفظ بها البيانات إلى أن تكون LJB‏ ثابتا ومحدودة النطاق. وعلى نحو 
مماثل» يكون تصميم البحث ole‏ في التجارب العلمية والدراسات Ail‏ غير مرن مجرد 
بدئهاء وذلك بهدف تمكين إجراء عمليات المقارنة والتكرار. أما في الدراسات التي تعتمد 
المقابلات أو الأنشطة الاجتماعية» فمن الممكن للباحث» على الرغم من ذلك» أن يكون أكثر 
مرونة في النهج «gl‏ وأن يكون لديه نموذج حر من الأسئلة وإمكانية التكيف مع الأوضاع 
ose uud‏ نكن تر SUIS‏ وتعليل هذه البزانات مرا نضا ولاق هنذا يوو 

le‏ إلى محدودية حجم ونطاق مجموعة البيانات. 

في المقابلء تم تصميم نظم البيانات الكبيرة لتكون مرنة بطبيعتهاء بحيث تحمل 
سمات قابلية الاستطالة والتفرع (يمكن إضافة حقول بيانات جديدة بسهولة) وقابلية 
التوسع ^x)‏ التوسع بسرعة) بغض النظر عن الحجم )2012 .(Marz and Warren‏ 
ويعني استخدام قواعد البيانات غير الهيكلية للاستعلام (NoSQL)‏ إمكانية jl]‏ البيانات 
ا لمتغيرة بسرعة عالية» والتكيف مع حقول البيانات الجديدة (انظر الفصل الخامس)» 
وهذا يعني أنه من الممكن التكيّف مع إنتاج البيانات على أسس 3923 ids‏ وأداء الاختبار 
على التكيف. فعلى سبيل JUL‏ تقوم شركات جوجلء والفيسبوك» ومنصات أخرى 
على الإنترنت بتعديل تصاميمهاء وجمع بيانات حول كيفية استجابة المستخدمين لهذه 
التغييرات على سبيل «JULI‏ مراقبة الزيارات العابرة للموقع» وتحليل النتائج واستخدامها 
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لتقديم do ye‏ من التعديلات المحسنة للتصميم بغية تشجيع إجراءات وردود معينة 
بشكل مستمر. ولأن أعداد الأشخاص الذين يستخدمون هذه المواقع هائلةء وأحجام 
العينات الخاصة بهم كبيرة dar‏ فهذا يعني أن بإمكانهم إجراء التغييرات دون الخوف 
من فقدان التمثيل. على سبيل «JULI‏ وبالعودة إلى حملة باراك أوباما الانتخابية, 
فقد أجرى فريق حملته تجارب متتالية عن مدى فعالية التعديلات المحسنة لموقع 
الحملة (BarackObama.com)‏ لزيادة المشاركة» والعمل التطوعي» والتبرعات. فأحد 
الاختبارات قيّم آثار التغيير على زر «اشترك» إلى «مزيد من المعلومات»» و «انضم إلينا 
الآن»» و«اشترك الآن»: وأصبح من الواضح على مدى ثلامائة آلف زيارة أن استخدام زر 
«انضم إلينا الآن» قد أدى إلى عشرين في المائة زيادة في الزائرين المقبلين على التسجيل 
في الموقع )2012 (Issenberg‏ 

فمثل هذه المواقع الكبيرة الحجم ينبغي أن تكون أيضاً قابلة للتوسع والتطويرء 
وقادرة على التعامل مع الطفرات الناشئة في طلب وإنتاج البيانات» حيث يتسبب مقدار 
حركة مرور البيانات في انهيار قاعدة البيانات العلائقية التقليدية العاملة على خادم 
واحد. فعلى سبيل ال مثال» هكن أن يزداد عدد التغريدات التي يتعامل معها تطبيق 
التواصل الاجتماعي تويتر بشكل ملحوظهء مع عشرات الآلاف من التغريدات التي يجري 
نشرها كل بضع ثوان أثناء الأحداث uI‏ مثل حفل افتتاح الألعاب الأوطبية أو خلال 
ا مباراة النهائية. وكان الحل هو تركيب أنظمة عتاد تتألف من أجزاء موزعة بحيث تخزن 
البيانات ف قواعد بيانات مقس مة عبر العديد من الخواذم مما يمكن من توسيع نطاق 
التخزين بحسب الحاجة. وعلاوة على ذلك. ففي بعض الأنظمةء مثل usd‏ يمكن تعيين 
dis LI‏ من قبل المستخدمين لتحديد ما إذا كانت تشمل البيانات آم لا. على سبيل المثال» 
يقرر المستخدمون في العديد من تطبيقات وسائل التواصل الاجتماعي وامتنقلة إدراج 
أو عدم إدراج مواقعهم» وكذلك البيانات التعريفية الرئيسية الأخرى المتعلقة بالهوية 
.(Gorman 2013)‏ 
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الخلاصة: 

البيانات الكبيرة هي ظاهرة حديثة, وبالنظر إلى التطبيق والانتشرر المتسارعين لهاء فقد 
يرك Bancs E‏ حول ما SGT US d‏ الكيرة والشعاقص dios EE‏ بها ويد 
بعض التعاريفء مثل تلك التي تنص على أن البيانات الكبيرة هي أي مجموعة بيانات 
كبيرة جداً بالقدر الذي لا يمكن معه تخزينها في جدول بيانات إكسل أو على جهاز واحد 
(Strom 2012)‏ مبتذلة للغاية وغير مفيدة» حيث تخفض مستوى مفهوم البيانات الكبيرة 
إلى خاصية الحجم فقط. لقد أصبح من الواضح أن لدى البيانات الكبيرة عدد من الخصائص 
الملازمة لها والتي تجعلها مختلفة نوعيا عن الأشكال السابقة من البيانات» وتم في هذا 
الفصل مناقشة الخصائص الأساسية السبعة للبيانات الكبيرة: الحجم» والسرعة» والتنوع» 
والشمولء والدقة / الفهرسة, والعلائقية» وا مرونة / قابلية التوسع التي تميزها عن البيانات 
الصغيرة (انظر الجدول (V-Y‏ 


فهذه هي دورة المستوى الأول فيما يتعلق بتقديم تقييم توصيفي لطبيعة البيانات 
الكبيرة. وهناك حاجة إلى مزيد من العمل لتقييم البيانات الكبيرة الناتجة عن مصادر 
متعددة لتحديد ما إذا كان هناك أصناف متنوعة في طبيعة البيانات الكبيرة. فعلى سبيل 
لقال قد تعمل بعض البيانات خمسا أو سا من هذه الخصائض» ولكتها لا sias‏ أو 
ضعيفة في واحدة أو اثنتين» وقد تفتقر مجموعة بيانات إلى التنوع (منظمة بشكل كبير)» أو 
الحجم (صغيرة ولكن شاملة مع حجم العينة ن = الجميع» أو قليلة السرعة e)‏ إنشاء 
البيانات بانتظام ولكن في كل شهر عوضا أن تكون بشكل مستمر). أو تفتقر إلى الفهرسة 
(كونها مجهولة المصدر أو مجمعة). مع حملها للخصائص الأخرى على سبيل المثال. فمن 
الواضح أن مثل هذه البيانات ليست بيانات صغيرة كما هو مبين في الفصل الثاني» ولكنها 
في ذات الوقت ليست بيانات كبيرة كما تفهم بمعناها الضيق الذي يصفها بكل الخصائص 
السبع» ولكن هكن اعتبارها على الرغم من ذلك شكلاً هن أشكل البياتات الكبيرة: وبعبارة 
أخرىء هناك حاجة لإنتاج تصنيف للبيانات الكبيرة قائم على أدلة تجريبية قوية مع أمثلة 
الحالات التي من شأنها أن تساعدنا على التفكير بصورة أكبر في طبيعة هذه البيانات. 
ويحتاج هذا إلى أن يكون مصحوباً بدراسة للخصائص الأغرىء مثل نوعية البيانات وصحتهاء 
ودقتهاء ومنشئها (انظر الفصل التاسع). 
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كما تثير الخصائص السبع للبيانات الكبيرة تساؤلات بشأن الآثار المترتبة على طوفان 
مثل هذه البيانات» وما الذي يعنيه القدرة على الوضول إلى بيانات كبيرة dae‏ وشاملة 
ومتغيرةء ودقيقة» ومفهرسة» ومتنوعة» وعلائقية. 3,55( وقابلة للتوسع بالنسبة للمجتمع 
والحكومة ورجال الأعمال؟ وإلى أي مدى يمكن أن توفر هذه البيانات رؤى ثاقبة عن 
حالة الإنسان أو المساعدة على تناول بعض القضايا الاجتماعية: والسياسيةء والاقتصادية, 
والبيئية الأكثر إلحاحاً والتي تواجه كوكب الأرض؟ أوء بدلا من خدمة الصالح ploi‏ فهل 
ستستخدم هذه البيانات لمزيد من خدمة ال مصالح الخاصة في الغالب؟ أو خدمة مصالح 
الدولة؟ وكيف سوف تغير هذه البيانات في نظرية ا لمعرفة العلمية في جميع المجالات 
(الآداب والعلوم الإنسانية» والعلوم الاجتماعية» والعلوم الفيزيائية والحياتية» والهندسة)؟ 
فالفصل السابع والثامن والعاشر ستناقش هذه القضايا بالتفصيلء وتقدم التفكير النقدي 
لآثار وعواقب البيانات الكبيرة. 
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ye 


ممكنات البيانات الكبيرة ومصادرها 


برز النمو السريع للبيانات الكبيرة نتيجة التطور المتزامن معه لعدد من التقنيات المساعدة 
والبنى التحتيةء والأساليب وال ممارسات. وتضمينها بشكل سريع في الأعمال اليوميةء وا ممارسات» 
والمساحات الاجتماعية. وتضمنت هذه البنية التحتية ا معرفية الجديدة إطلاق طيف واسع 
من مجموعة متنوعة من تقنيات ا معلومات والاتصالات. وخاصة خدمة الإنترنت الثابتة 
والمتنقلة عبر الهاتف المحمول؛ وإدخال البرمجيات في جميع الكائنات, والآلات والأنظمة: ناقلة 
la]‏ من «الغباء» إلى «الذكاء» فضلاً عن إنشاء أجهزة وأنظمة رقمية بحتة بالكامل؛ وتطوير 
الحوسبة الشمولية الواسعة الانتشار والقدرة على الوصول إلى الشبكات والحوسبة في العديد 
من البيئات» وعلى ذات خطى هذا التحرك؛ التقدم في تصميم قواعد البيانات ونظم إدارة 
ا معلومات؛ وعروض التخزين الموزع والتخزين الأبدي للبيانات بأسعار معقولة؛ والأشكال 
الجديدة من cales‏ البيانات المصممة als)‏ مع وف البيافات بدلا من تدرتها. 

وإضافة إلى تمكين الوصول والمشاركة والتخزين للبيانات» تعد البنية التحتية وا معرفية 
الجديدة في الغالب الوسيلة التي يتم إنتاج الكثير من البيانات الكبيرة منها. ففي الواقع, 
وبلا شك أن الحالة في وقتنا الحاضر تتمثل في أننا نعيش في مجتمعات تستخدم على نحو 
متزايد تقنيات البيانات المكثفة واممنتجة لها وتنتظم على أساسها. كما أصبحت الممارسات 
الشخصية في الاتصالء والاستهلاكء والإنتاج» والسفرء والحياة :445 أكثر فأكثر تتوسّطها 
الأجهزة الرقمية التي تنتج الكثير من البيانات المستنفذة القيّمة. وعلاوة على ذلك يتم 
الآن مراقبة وتنظيم الأماكن التي نعيش فيها على نحو متزايد بمجاميع كثيفة من التقنيات 
والبنى التحتية المدغمة بالبيانات» مثل أنظمة المرور وإدارة «Lll‏ ونظم المراقبة والشرطة, 
وقواعد البيانات الحكومية» وإدارة العملاء وسلاسل الدعم اللوجستية» والأنظمة امالية 
ونظم المدفوعات. وستناقش العوامل المساعدة ومصادر البيانات الكبيرة بالتفصيل في هذا 
الفصل. 
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العوامل المساعدة للبيانات الكبيرة: 

تعد البيانات الكبيرة مُحصلة للتطور والتقارب بين مجموعة متقدمة من التقنيات في 
مجال الحوسبة منذ نهاية الحرب العاممية الثانية. ويشمل ذلك إنتاج أجهزة الحاسب 
المركزية في الخمسينيات والستينيات؛ وشبكات الإنترنت الوليدة في السبعينيات والثمانينيات 
التي ربطت الحاسبات بعضها ببعض؛ والانتشار الواسع النطاق للحاسبات الشخصية في 
الثمانينيات والتسعينيات؛ والنمو الهائل للإنترنت في التسعينيات» وتطوير الصناعات القائمة 
على الويب» جنباً إلى جنب مع النمو الهائل في الهواتف النقالة والأجهزة الرقمية مثل أجهزة 
الألعاب والكاميرات الرقمية؛ وتطوير الحوسبة السحابية: والموزعة:. والنقالة. وتقنيات 
الإصدار الثاني لشبكة الويب )2.0 (Web‏ في بدايات الألفية الثانية؛ وتفشي الحوسبة الشمولية 
واسعة الانتشار (Ubiquitous and Pervasive Computing)‏ خلال هذا العقد. وخلال 
هذه الفترة وقع عدد من المؤثرات التحويلية» فزادت القدرة الحاسوبية أضعافاً مضاعفة 
وتم ربط الأجهزة dee‏ وتداخلت الأنظمة الرقمية بازدياد متعاظم في شئون الحياة اليومية 
وعملياتهاء وأصبحت البيانات أكثر من أي وقت مضى مفهرسة وقابلة للقراءة الآليةء كما 
توسعت أنظمة تخزين البيانات وأصبحت موزعة. 


الحوسبة :(Computation)‏ 
بينما قدّمت الحواسيب الرقمية المركزية الأولية في الخمسينيات والستينيات قدرة 
حاسوبية أكثر كفاءة من تلك التي عند البشر والأجهزة التناظرية التي استخدموها (مثل 
المعداد, والآلات الحاسبة AKAI‏ والآلات الحاسبة بالبطاقات الممثقوبةء وأجهزة 
الحاسب التناظرية. إلخ)» إلا أن قوة المعالجة لها كانت محدودة: ومن ثم كانت أنواع 
العمليات التي يمكن أداؤها مقيدة. وعلاوة على ذلك كانت تلك الحواسيب كبيرة الحجم 
ومكلفة. على سبيل «JUL‏ كان بإمكان حاسب الإينياك Electronic Numerical)‏ 
(Integrator Analyser and Computer- ENIAC‏ الذي à 3b‏ منتصف الأربعينيات» 
أداء خمسة آلاف عملية جمع وطرح في الثانيةء ولكن اقتصرت 3,515« الرئيسية عالية 
السرعة على عشرين كلمة (أي ثمانين (cab‏ لآلة تزن ثلاثين طنا وتحتوي ٠۸,٠٠١‏ 
أنبون فراغيء 9 * * *,10 «Jo pa‏ ومئات الآلاف من المقاومات والمكثفات والمحاثات, 
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وباستخدام مائتي كيلوواط من الطاقة الكهربائية )2004 .(Najmi‏ وفي العام «e VO‏ 
توقع Gordon Moore‏ من إنتل ob‏ يتضاعف عدد الترانزستورات في الدوائر المتكاملة 
كل ثمانية عشر شهراً في العقد المقبل ذلك الحين» مما يزيد بشكل كبير القدرة الحاسوبية 
(وهو ما أصبح يُعرف لاحقا باسم قانون مور). وقد أثبت هذا التوقع بصيرة نافذة حيث 
e‏ إدخال تحسينات تقنية على مكونات وتصميم أجهزة الحاسب (من خلال الانتقال 
من الأنابيب الفراغية إلى الترانزستورات إلى الدوائر المتكاملة إلى المعالجات المصغرة)» 
وازدادت القوة الحسابية فيما يقرب من الخمسين في المائة سنوياً بين عامي ۱۹٤١‏ م 
و١١٠٠م‏ )2002 dlo .(Nordhaus‏ جانب هذا النموء انخفضت تكلفتها بشكل کبیرء 
حيث تشير إحدى التقديرات بانخفاض في تكلفة الحساب ناهز أضعاف الكوادريليون 
(Yee )‏ خلال القرن العشرين )2003 (CRA‏ 

استمرت مثل هذه الزيادات الهائلة في القدرة الحاسوبية والانخفاضات الكبيرة في 
التكلفة في الألفية الجديدة, ولكن الأهم من ذلك أنها أصبحت متنقلة على نطاق glo‏ 
مع انتشار مكثف للأجهزة الحاسوبية المحمولة مثل أجهزة الحاسب ال محمولء والأجهزة 
اللوحية والهواتف ASII‏ وأجهزة الملاحة المرتبطة بالأقمار الصناعية (SatNav)‏ وغيرها. 
وتعادل قوة المعالجة للهاتف الذي المتوسط "عشرة أضعاف قوة جهاز الحاسب المركزي 
كراي1- (Cray-1)‏ الذي تم تشغيله في مختبرات لوس ألاموس الوطنية في عام 1976م " 
«(Townsend 2013: xiii)‏ مع استخدامها جزء من قوة معالجتهاء حيث تمتلك قدرات 
das alo‏ وتخزينيةء وتطبيقات أكثر من العديد من أجهزة الحاسب الشخصية منذ 
عقد واحد فقط من الزمنء وهي أيضاً تشغل جزء بسيط في حجم العتاد المستخدم. 
ue‏ سيل اتال لدف العديد من المواتق الذكية معالها Sua‏ را Y,* - VO ác jun‏ 
غيغاهرتز و7١‏ - ۲۲ غيغابايت من الذاكرة الرئيسية. وتمكن هذه القوة في ا معالجة 
ds us‏ الذاكرة من :مخالجة كنيات كبيرة جد من البيانات بسرغة: ليق 02533 dala‏ 
لأنها متصلة شبكياً ومشتركة. 


ثورة البيانات البيانات الكبيرة» والبيانات المفتوحة, والبنى التحتية للبيانات» والنتائج المترتبة عنها 1 


الفصل الخامس 


الربط (Networking)‏ 
بذات القدر من الأهمية للنمو الكبير في القوة الحسابية olek‏ البيانات الرقمية كان 
الربط بين الحاسبات بعضها مع بعض والذي سهل نقل وتبادل البيانات فيما بينها. وقد 
وقع أول اتصال شبكي بين جهازي حاسب عبر شبكة الإنترنت في نوفمبر عام p VAM‏ وقد تم 
الربط بين نقطة في جامعة كاليفورنيا في لوس أنجيلوس (UCLA)‏ ونقطة أخرى في جامعة 
ستانفورد )1995 (Salus‏ ثم نمت الشبكة ببطء» من dla W‏ في يناير eyvi‏ إلى ۲۳ في 
أبريل VY‏ إلى 57 في يونيو «e AVE‏ و۱۱۱ بحلول مارس ۱۹۷۷م واقتصرت حينها على 
متعاقدي وكالة مشاريع البحوث المتطورة الدفاعية ARPA) (Hart et al. 1992; O'Neill)‏ 
5. وتعمل شبكة الإنترنت من خلال تقطيع البيانات والتعليمات في حزم متساوية 
الحجم ونشرها عبر النظام» مع عنونة كل حزمة بمعرف وعنوان المرسل إليه ا مطلوب, ثم 
تمرّر JS‏ حزمة من نقطة اتصال إلى أخرى إلى أن تصل إلى الوجهة المقصودة حيث يتم إعادة 
تجميعها هناك. ولتمكين اتصال الأجهزة والشبكات التي تعمل على سرعات مختلفة على 
مدار الساعة وتستخدم حزماً مختلفة الحجم» اعتمدت مجموعة معيار (بروتوكول) الشبكة 
تي سي بي / آي بي (TCP/IP)‏ (معيار التحكم بالإرسال / بروتوكول الإنترنت) في عام ۱۹۷۳ 
(ONeill 1995)‏ ولا Ul»‏ هذا المعيار يستخدم حتى يومنا هذا. كما يؤكد هذا المعيار على 
حيادية الشبكة» حيث يتم التعامل مع كافة البيانات على قدم اممساواة ودون تمييز بينها أو 

تفاضل في التكلفة )2011 (Wu‏ 

وبحلول أواخر السبعينيات» تمّ eU]‏ الشبكات المحلية الداخلية» كما e3‏ إنشاء الشبكات 
الأخرى دوليا وتم ربطها بشبكة الإنترنت الوليدة» إضافة إلى شبكات الهواة المستقلين 
والشركات» كما أصبح من الممكن إرسال حزم البيانات عبر الأقمار الصناعية. وبالإضافة إلى 
نقل البيانات وال ملفات» تم إنشاء البريد الإلكتروني واللوحات الإعلانية )1998 „(Kitchin‏ 
وخلال الثمانينيات» نمت البنية التحتيةء مع لاعبين جدد من المؤسسات والشركات» Uie‏ إلى 
جنب مع تطور شبكات الإنترانت الداخلية (الشبكات الخاصة). وفي عام ۱۹۹۲م اخترع تيم 
بيرنرز (Tim Berners-Lee) d‏ من سيرن à (CERN)‏ جنيف الشبكة العامطية (الويب)ء 
وقذم وسيلة سهلة الاستعمال أكثر بكثير للوصول إلى الإنترنت واستخدامها. وخلال 
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التسعينيات وبدايات الألفية الجديدة تم تطوير تقنيات شبكية جديدة مثل شبكات اتصال 
اميدان القريب (NFC)‏ والتواصل المباشر (Proximate Communication)‏ باستخدام 
yles‏ البلوتوث: والتغطية المحلية اللاسلكية الواي فاي (WiFi)‏ والشبكات الوطنية 
للاتصالات المتنقلة (GSM/3G)‏ ووفقاً لقوانين جورج غيلدر )2000( (George Gilde)‏ 
في الاتصالات. فإن إمدادات العام من عرض النطاق الترددي (قدرتها على نقل البيانات) 
تتضاعف كل ستة أشهرء مع مزيد من القدرة الإضافية التي leds‏ الشبكات اللاسلكية. 
ونتيجة oda)‏ التطورات: فقد أصبح الربط متاحاً بين الأجهزة الحاسوبية من خلال شبكة 
الإنترنت بشكل أسهل على نحو متزايدء وأسرع des‏ نطاق أوسع. 


الحوسبة الشمولية واسعة الانتشار: 

صاحب التوسع في النفاذية وقدرة الوصول إلى شبكات تقنية ال معلومات والاتصالات 
وزيادة سعات قنوات الاتصال (عرض النطاق الترددي). £53 وتوسّعٌ في الأجهزة الرقمية 
والتي تتصل إما بشكل مباشر أو غير مباشر (حيث يتم تحميلها على جهاز آخر أولا) 
بشبكة الإنترنت لتبادل البيانات» أو التعليمات» أو الحصول على التحديثات البرمجية. 
ففي بعض الحالات» حلت التقنيات الرقمية الجديدة محل الأشكال السابقة من البيانات 
التماثلية / التناظرية» فعلى سبيل e3 «JULI‏ استبدال أنظمة الهاتف التماثلي بالهواتف 
ا محمولة والهواتف ASII‏ واستبدلت كاميرات المراقبة التناظرية التي تسجّل على شريط 
فيديو بكاميرات رقمية تلتقط الصور الرقمية» ويجري الاستعاضة عن الموسيقا ا مخزنة 
على الشريط المغناطيسي أو الفينيل بملفات صوتية رقميةء والنماذج الورقية بأخرى 
إلكترونية على الإنترنت. من هنا تم تحويل الأجهزة والأنظمة التي كانت تعد نسبيا 
«غبية» لتصبح «ذكية» ببعض الطرقء وعادة من خلال استخدام البرامج المرتبطة بها 
(Dodge and Kitchin 2005)‏ وتعني كلمة «الذكية» هنا بشكل عام بأن الجهاز قد 
تمت dim p‏ ليكون lel‏ للطريقة الخاصة التي يستخدم بها وقادراً على اتخاذ قرارات 
مستقلة» dolg‏ ومؤتمتة من مجموعة الخيارات المحددة من خلال تطبيق خوارزميات 
على البيانات المنتجة (انظر 20072 (Dodge and Kitchin‏ وخير مثال على تجميع 
تقني «غبي» أصبح على نحو متزايد «ذكي» هو السيارةء فالسيارة الحديثة يتم تحميلها 
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بأجهزة رقمية» ومستشعرات ومحركات» والتي تراقب وتنظم أنظمتها المختلفة وتتداخل 
مع تجربة القيادة )2004 (Thrift‏ ويمكن أن تنتقل البيانات المخزنة من هذه الأجهزة 
عبر شبكات الاتصالات عن بعد للشركات أو تحميلها من قبل مهندس لإجراء تحليل 
تشخيصي )20072 à» .(Dodge and Kitchin‏ حالات أخرىء هناك أجهزة لا مكافئ 
تناظرياً da)‏ حيث تنتج بيانات جديدة LIS‏ في شكلهاء مثل تلك الناتجة عن أنواع جديدة 
من التقنيات الرقمية» وا مسح «Jl‏ وأجهزة الاستشعار على سبيل «JULI‏ ماسحات 
التصوير بالرنين المغناطيسي MRI‏ في مجال daal‏ وإضافة إلى جعلها «ذكية» فإن 
الأنظمة تعمل في الغالب على جمع أكبر قدر من البيانات قدر الإمكان» وتسعي لتكون 
هذه البيانات شاملة وليست انتقائية. وهناء قد يتم جمع بيانات عرضية أو غير ضرورية 
لتوفير الخدمة أو العملية» مثل التفاصيل الشخصية أو الموقع الجغرافي. فغالبا ما تحدد 
الإعدادات الافتراضية للأجهزة بشكل يتيح للناس إمكانية اختيار الانسحاب من أنظمة 
e]‏ البيانات من خلال عقود الاستخدام للبرمجيات والمواقع: مع النص على العقوبات إذا 
اختاروا القيام بذلك» مثل تردي الخدماتء والتكاليف الإضافية» أو حجب الخدمة بالكلية. 

وبا مثلء حصل هذا النمو في الأجهزة الرقمية في «Jl‏ وفي الشارع. وف أماكن العملء 
وعبر شبكات النقلء وفي غيرهاء مما دفع المعلقين للافتراض Lal‏ قد ولجنا عصر (البرمجيات 
في كل مكان -2006 .(EveryWare) (Greenfield‏ إذن» هذا هو pas‏ الحوسبة واسعة 
الانتشار في كل مكان» حيث يتم توزيع القدرة الحاسوبية وإتاحتها في كل «Os‏ مع العديد 
من الأجهزة الحاسوبية التي تعمل لكل شخص )2012 (Lucas et al.‏ فالحوسبة المنتشرة 
(Pervasive Computing)‏ هي إضافة للقدرة الحاسوبية وإتاحة الوصول إلى شبكات 
تكنولوجيا المعلومات والاتصالات للكائنات والبيئات اليومية الثابتة لجعلها تفاعلية و«ذكية» 
.(Dourish 2001)‏ وفي اممقابلء فإن الحوسبة في كل مكان (Ubiquitous Computing)‏ 
هي القدرة الحاسوبية التي تتحرك مع الشخص بغض النظر عن البيئة؛ كالأجهزة التي 
يحملها الناس مثل الهواتف الذكية وأجهزة الملاحة عبر الأقمار الصناعية التي تعتمد على 
الوصول إلى شبكات تقنية المعلومات والاتصالات لتقديم الخدمات. وإذا كان شعار الحوسبة 
امنتشرة هو الحوسبة «في كل شيء»» فإن شعار الحوسبة في كل مكان هو الحوسبة «في JS‏ 
مكان»» مع إبراز الحوسبة المنتشرة لعمليات التباعد والتفرع (تضمين البرمجيات في مزيد من 
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الأجهزة) وإظهار الحوسبة في كل مكان لأوجه التقارب (جهاز رقمي واحد للقيام 4354 من 
المهام) )2011 .(Kitchin and Dodge‏ وبينما يلزم الحوسبة المنتشرة أن تكون على إدراك 
موقعي /موضعي (Situationally Aware)‏ لتنفيذها بنجاح» تتطلب الحوسبة في كل مكان 
الإدراك المستمر للسياق وا موقع. 

قابلية الفهرسة والقراءة الآلية :(Indexicaland Machine-Readable Identification)‏ 


على مدى نصف القرن الماضيء أصبحت الظواهر في العام أكثر وأكثر تحديداً بشكل 
فريد ومن السهولة التقاطها كبيانات. بسبب التقنيات الرقمية وتقنيات العنونة ووضع 
العلامات الجديدة, مما olj‏ في درجة دقتها وعلائقيتها ومن ثم مستوى التفصيل في تحليلهاء 
بالإضافة إلى تمكين ربط مجموعات بيانات أكثر (انظر الفصل الرابع). فعلى سبيل «JULI‏ 
تتميّز كل الأجهزة الرقمية التي تساهم في الحوسبة المنتشرة والحوسبة في كل مكان بمعرف 
فريد مُفْهْرسء بحيث يعن رمز تعريف حصري لكل منها مما يتيح رصدها وتتبّعها على 
الدوام. وعلاوة على «US‏ فإن جميع pole‏ إنترنت الأشياء «Internet of Things- IoT)‏ 
كوكبة واسعة من الأجهزة المتصلة بالشبكة. المحركات» وأجهزة ol AMI‏ تنتج بيانات 
مفهرسة مكن تمييزها بشكل فريد )2004 .(Gershenfeld et al.‏ وإضافة U‏ فإن 
المعرفات الفريدة التي تم ربطها بالناس منذ زمن طويلء مثل جوازات السفرء والبطاقات 
الصحية. وسجلات التأمينات الاجتماعية» قد جرى تعزيزها من خلال أنظمة تحديد الهوية 
الرقمية والحيوية الجديدة التي تربطها بقواعد بيانات رقمية تتحقق من هويتهم Dodge)‏ 
.(and Kitchin 2005‏ وهذه تشمل أسماء ال مستخدمين وكلمات السرء وبطاقات السحب 
المغناطيسية. والقارئات الرقمية لبصمة الأصابع» وقزحية cgl‏ والحمض النووي. وفي كل 
حالة» تعد هذه المعرفات بمثابة المصافحة الرقمية» على الرغم من أنها تختلف في مستواها 
من حيث الدقة والثقة. فعلى سبيل المثال» يمكن لأسماء المستخدمين وكلمات المرور أن 
تسرق أو تزور بسهولة؛ في حين أن الحمض النووي هو أصيل وفريد لكل شخص ويحقق 
المعايير الأربعة الأولى من قائمة كلارك (Clarke 1994b)‏ المتعلقة بالخصائص ال مرغوب 
فيها لتحديد هوية الكائن البشري بشكل فعال وهي: شمولية التغطية / النطاق (يجب 
أن يمتلك الجميع الخاصية نفسها)؛ التفرّد (يجب أن يمتلك كل شخص قيمة واحدة فقط 
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لهذه الخاصيةء ولا يتساوى فيها أي شخصين)؛ الدوام v)‏ أن لا تتغير قيمة الخاصية 
رور الزمن» ولا تكون قابلة للتغيير أيضاً)؛ اللزوم (عنى أن تعد الخاصية صفة طبيعية 
لا مكن إزالتها ولا غنى عنها). وهذه الصفات تتوافق مع الصفات السبع الأخرى وهي: 
القدرة على التحصيل/ الجمع؛ والقدرة على التخزين؛ والتفرد؛ والدقة؛ والبساطة؛ والتكلفة 
والتناسب؛ والقبول. 

وبا مثل» فإن رموز التحديد المكانية هي أنظمة 3303 مواقع الأشخاص: والأماكنء 
والكائنات في جميع أنحاء العام» وتشمل خطوط الطول والعرضء وإحداثيات الخرائط 
الشبكية. والوحدات الإدارية مثل الرموز البريدية (Zip Codes)‏ وتختلف هذه الأنظمة 
في نطاقها ودعي (درجة التفصيل). وقد أصبحت أكثر 35 kisss à‏ من أي وقت مضي. 
فعلى سبيل «JULI‏ توسم البيانات الإدارية بالنسبة إلى الملكيات الفردية أو قطع الأراضي بدلا 
من الأحياء؛ كما deua‏ أي جهاز يحوي نظام تحديد المواقع العالمي Global Positioning)‏ 
(System- GPS‏ الموقع في نطاق بضعة آمتار؛ وبدأت أنظمة الخرائط الوطنية بإسناد عدد 
كبير من الكائنات الناشئة بفعل بشري أو طبيعي في المخططات الخرائطية بمعرفات إقليمية 
فريدة. ويوجد معرفات فريدة أخرى شائعة على نحو متزايد للمنتجات (انظر الفصل 
«(aol JI‏ والمعاملات (على سبيل JEL‏ طلبات الشراء)» والتفاعلات (على سبيل JEBI‏ البريد 
الإلكتروني والمكالمات الهاتفية). 

و عن كونها jS]‏ قابلية للفهرسة والتبويب» أصبحت رموز تحديد الهوية قابلة 
للقراءة الآلية We‏ على نحو متزايد )2005 .(Dodge and Kitchin‏ على سبيل «JULI‏ 
يحتوي الرمز الشريطي (Barcode)‏ على رمز تعريف يرتبط بنظام معلومات يحتفظ ببيانات 
وصفية إضافية تصف الكائن عند مسحه بقارئ ليزري (مثل نوع المنتج / النموذجء تاريخ 
ومكان الصنع» الأسعارء وما إلى ذلك). كما يمكن استشعار رقائق تحديد الهوية باستخدام 
موجات الراديو (RFID)‏ عن بعد من قبل مستجيب راديوي والتعرف عليها. ويمكن 
كذلك التعرف على المركبات بواسطة برنامج التعرف التلقائي على أرقام لوحاتهاء وقد تم 
تطوير تقنيات خوارزمية جديدة للتعرف وتحديد هوية الوجوه وطريقة (sil‏ (كيف ممثي 
الناس). وهكذا أصبحت عناص ر/ كائنات العالم مفتوحة لجمع والتقاط بياناتها وتحديد 
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هويتها تلقائياء مما gigs‏ بشكل كبير نطاق البيانات المنتجة ومدى دقتها بالنسبة إلى نظام 
ماء مما yis. i p‏ جديدة من التنظيم والحوكمة )20072 (Dodge and Kitchin‏ وعزز 
عمل الأنظمة بطرق أكثر آلية )2011 ((Kitchin and Dodge‏ لذا فإن الاتجاه السائد هو 
ا مزيد والمزيد من التحديد للظواهر وا ممارسات لتصبح معرفة بشكل فريد وقابلة للقراءة 
آليا هما يويد الدقق:والعلاتقية. Ala‏ 


تخزين البيانات :(Data Storage)‏ 
كان هناك تحوّل cus‏ على مدى العقدين الماضيينء في القدرة على التخزين الطويل 
الأمد لكميات هائلة من البيانات» ففي البداية تم تخزين البيانات الرقمية في صورة تناظرية 
باستخدام البطاقات المثقوبة وذلك قبل أن يتم الانتقال إلى الشريط ا مغناطيسي والأقراص 
الصلبة. وقد استكملت هذه الوسائل باستخدام وسائط التخزين الرقمية المتنقلة والتي 
تعرف باسم الأقراص المرنة (Floppy Disks)‏ وتلا ذلك ظهور الأقراص الدمجة (CDs)‏ 
وأقراص الفيديو الرقمية (DVDs)‏ ومحركات الأقراص الخارجية والذاكرة المتنقلة Flash/)‏ 
(External Drives‏ وقد دفعت تقنيات الأقراص الصلبة (Hard-disk Technologies)‏ 
على وجه الخصوص, بالقدرة على تخزين البيانات الرقمية بشكل كبيرء وذلك مع النمو 
الكبير للسعة التخزينية المقدرة بالخانة الثنائية لكل بوصة مربعة (بت/إنش2)). في حين 


1956 إلى 2000م )2000 (Gilheany‏ واستمرت الأسعار في الهبوطء مما جعل التخزين 
الرقمي أرخص تكلفة بكثير وأقل مساحة من الأشكال التناظرية (على سبيل «JULI‏ الورق أو 
الأشرطة الفلمية) )2003 (Grochowski and Halem‏ فالآن: أصبحت التكاليف رخيصة 
جداً وبالشكل الذي يمكن من تخزين كميات هائلة من البيانات بمقابل بخس» ودون 
الحاجة تقريباً لحذف الملفات القديمة. ونتيجة لذلك فإن coal]‏ التي تجري اليوم (على 
سبيل «JULI‏ رسالة أرسلت إلى قائمة البريد الإلكتروني أو صفحة موقع التواصل الاجتماعي 
الفيسبوك» أو المدفوعات إلى متجر باستخدام بطاقة الائتمان» أو المحادثة مع أحد الأصدقاء 
على الهاتف) من الممكن تسجيلها وحفظها بشكل جيد إلى ما بعد وفاة الشخص المعني بهاء 
مع إمكانية الإشارة إليها وتحليلها في أي وقت في المستقبل. 
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ونتيجة EU‏ وكما نوقش في الفصل السابقء كان النمو في حجم البيانات المخزنة 
بالأرقام المطلقة والنسبية استثنائياء وخاصة منذ العام2000م. فعلى سبيل JELI‏ 238 
Hilbert and López (2009)‏ أن خمسة وعشرين في المائة فقط من البيانات تم 
تخزينها في شكل رقمي في عام 2000 مع الاحتفاظ ها تبقى بأشكال تناظرية مثل الكتب» 
وا مجلات» والصورء والأشرطة الممغنطة. وبحلول عام 2007 «e‏ شكلت البيانات الرقمية ما 
نسبته أربع وتسعون ف المائة من مجموع البيانات اممخزنةء ومنذ ذلك الحين تواصل النمو 
للحصة النسبية من البيانات الرقمية» خاصة مع تطور التخزين والخدمات الموزعة من 
خلال الحوسبة السحابية ومراكز البيانات. وتأخذ الحوسبة السحابية أحد شكلين يعملان 
في الغالب بصورة تعاونية: سحب امرافق الخدمية (Utility Cloud)‏ وسَحب البيانات 
التخزينية )2011 (Data Clouds) (Farber et al.‏ فالسحب الخدمية e‏ القدرات 
والإمكانات المتعلقة بتقنية المعلومات كخدمات حسب الطلب حيث ممكن الوصول إليها 
عن طريق شبكة الإنترنت وذلك بشكل مستقل عن موقع طالب الخدمة. ويشمل ذلك 
«البنية التحتية كخدمة» (Infrastructure as a Service- IaaS)‏ مثل التخزين والخوادم 
والشبكات. «المنصة كخدمة» (Platform as a Service- PaaS)‏ وتضم بيئة التنفيذ 
لتطوير تطبيقات مخصصة وقواعد البيانات» و«البرمجيات كخدمة» Software as a)‏ 
(Sservice- SaaS‏ والتي تمكن المستخدمين من الوصول إلى التطبيقات ومعالجة البيانات 
عن بعد )2012 Farber et al. 2011; Hancke et al.‏ ). في حين کن سحب البيانات 
من ربطء تخزينء ومعالجة كميات هائلة من البيانات التي قد تنتج عبر المؤسسة عن 
caso‏ بالاعتماد على القدرة الحاسوبية لمئات من الأجهزةء وتحليلها عن طريق سحب 
المرافق الخدمية )2011 (Farber et al.‏ ومن ثم» يمكن للأفراد والشركات الاستفادة 
من التخزين والقدرة الحاسوبية دون الحاجة إلى القيام باستثمارات رأسمالية كبيرةء فضلا 
عن كونها قادرة على الاستفادة من هذه اللموارد من أي مكان يتوافر فيه اتصال بالإنترنت 
(Bryant et al. 2008)‏ 


وبا مثل» كان هناك تحوّل في كيفية تنسيق البيانات وهيكلتها عند تخزينهاء وبسبب 
للبقاء ومواجهة الموقف. فقد صَمّمت لبيانات على درجة عالية من التنظيم» والسلامة, 
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والمنظمة؛ والثابتة. وبدلاً عنهاء ظهر شكل جديد من قواعد البيانات هو قواعد البيانات 
غير الهيكلية (NoSQL)‏ مما يتيح تخزين البيانات الكبيرة. وتميل قواعد البيانات غير 
الهيكلية إلى أن تكون أقل تعقيداً في الشكل من قواعد البيانات العلائقيةء ولكن يمكنها 
التعامل مع كل من البيانات المنظمة (Structured Data)‏ وغير المنظمة Unstructured)‏ 
(Data‏ وهي قابلة للتوسع cde po‏ ويمكنها التعامل فعلاً مع العديد من مجموعات 
بيانات سريعة التغير وهائلة في الحجم» وتمتاز با مرونة في كيفية تنظيمهاء مما يتيح هياكل 
بيانات مفصلة بحسب الطلب )2012 .(Driscoll 2012: Marz and Warren‏ كما 
تميل قواعد البيانات غير الهيكلية إلى تخزين البيانات الابتدائية الخام بدلاً من المشتقة 
التي يتم هيكلتها G‏ لعلاقة محددة .(Driscoll 2012) Uhat‏ فعلى سبيل «JULI‏ > تخزن 
قواعد البيانات غير الهيكلية معلومات خام عن زيارة صفحة الويب (المشاهدة) بدلاً 
من تخزين تعداد المشاهدات للصفحات المشتقة منهاء وهي إستراتيجية أكثر قوة من 
حيث أنها تقلل من الأخطاء المحتملة في قواعد البيانات. ولكن هذه الإستراتيجية لا هكن 
تطبيقها مع قواعد البيانات العلائقية بسبب النمو السريع والحجم الناتج من ذلك النمو 
والذي لا يمكن التعامل معه من خلالها )2012 .(Marz and Warren‏ ويتم في العادة 
توزيع البيانات وتكرارها عبر العديد من الأجهزة في قواعد البيانات غير الهيكلية, Ya‏ من 
مركزيتها في مكان واحد (ومن ثم حل مشكلة ligaga‏ البيانات الكبيرة جداً كونها كبيرة 
lae‏ عن أن يجري احتواؤها على جهاز واحد)» وتقسّم طلبات الاستعلام ويجري تنفيذها في 
الوقت نفسه على عدد من الأجهزة جنباً إلى جنب ثم يُعاد تجميع النتائج (ومن ثم تسريع 
العملبات الحسايية) )2012 ass .(Dumbill‏ هذه اللإسة dam‏ من خلال dus‏ 
التعيين والاختزال (ReduceMap)‏ التي تم تطويرها من قبل شركة جوجل حيث يتم تعيين 
البيانات والاستعلامات على عدة خادمات ومن ثم جمع النتائج الجزئية واختزالها معا 
.(Dumbill 2012)‏ ويعد هادوب (Hadoop)‏ الذي تم وضعه بداية من قبل شركة ياهو 
(Yahoo)‏ مثالاً على قواعد البيانات غير الهيكلية ومفتوحة المصدر وشائعة الاستخدام في 
تطبيق نموذج التعيين والاختزال. فالحل البديل ممثل هذا النهج يتمثل باستخدام نموذج 
أكثر محدودية للبيانات» ودرجة أقل من العلائقية في مجموعة البيانات» وقدرة أقل على 
الاستكشاف باستخدام لغة الاستعلام العلائقية )2012 (SQL) (Driscoll‏ وهذا يعني أن 


ثورة البيانات البيانات الكبيرة» والبيانات المفتوحة, والبنى التحتية للبيانات» والنتائج المترتبة عنها 10۷ 


الفصل الخامس 


قواعد البيانات غير الهيكلية مثالية للتخزين الفعال والاسترجاع السريع لكميات هائلة من 
البيانات» ولكنها أقل فائدة لفحص العلاقات بين عناصر البيانات (مركز تحالف البيانات 
امفتوحة 2012 Open Data Center Alliance‏ 


مصادر البيانات الكبيرة :(Sources of Big Data)‏ 
وفر التوسع الجذري والتكامل بين الحوسبة. والشبكات. والأجهزة الرقميةء وتخزين 
البيانات منصة قوية لانطلاقة البيانات الكبيرة وإضافة لذلك الوسيلة التي يتم بها إنتاج» 
ومعالجة» ومشاركةء وتحليل البيانات الكبيرة. ويمكن تصنيف هذا الإنتاج للبيانات في ثلاث 
فئات رئيسية. البيانات الموجهة (Directed Data)‏ والتي يتم إنتاجها بوسائل مراقبة 
تقليدية حيث تتركز أنظار التقنية على شخص أو مكان من قبل مشغّل بشري. أما في حالة 
البيانات الآلية (Automated Data)‏ فتنتج البيانات عن وظيفة كامنة في الجهاز أو النظام 
بطريقة تلقائيةء في حين يتم تداول البيانات الطوعية (Volunteered Data)‏ وإهداؤها من 

قبل الناس للنظام. 


:(Directed Data) البيانات الموجهة‎ 


توجد المراقبة المنظمة والهيكلية حيثما وجدت مجموعة من الناس الذين يشرفون 
على أشخاص آخرين كال مسؤولين عن إنفاذ القانونء وا معلمينء والأطباء ومسؤولي الرعاية 
الاجتماعية» والبيروقراطيين» ورؤساء العمل والذين يعملون على مراقبة الآخرين شخصيا 
كامواطنين» والتلاميذ» والمرضىء والعمال أو من خلال العدسات التقنية كا مسوح مثل التعداد 
السكانيء ونماذج البيانات الحكومية. وإيصالات الضرائب» وعمليات التفتيشء وكاميرات 
مراقبة الدوائر التلفزيونية ا لمغلقة (CCTV)‏ حيث كانت المراقبة المنظمة والهيكلية 
ds‏ رة aie 8a a d‏ اساسا A EIS actos‏ وسوكمة 
الشركات )2007 (Lyon‏ فهذا النموذج للتحكم (التداخل ال منطقي» الأدوات: المؤسسات» 
وأدوار وإجراءات الحوكمة) يتيح مركزية التنظيم والتحكم عبر مجموعة واسعة من 
المجالات. ويساعد في الحفاظ على النظام» وإنتاج حكومة جيدةء وإدارة فعالةء وعمل مربح» 
ومجتمعات مستدامة ومستقرة» من خلال المحاسبة الفعّالة للأشخاص والتهذيب الذاتي 
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أيضا (معنىء تعديل الناس سلوكهم ليتوافق مع التوقعات والقواعد). وتستكمل هذه 
النظم بطرق تحديد هوية الأفراد. مثل بصمات الأصابع؛ والصورء وأرقام التأمين الوطني أو 
الضمان الاجتماعي» وجوازات السفر ورخص القيادة التي تجعل من السهل تتبع واقتفاء 
أثر الناس» كما eI‏ توسيع نطاق المراقبة ليشمل الحيوانات والبيئات» واستخدام الكائنات 
وحركتها. 

وحتى وقت قريب» كانت كل عمليات امراقبة جزئية وتناظرية بطبيعتها وتنتج 
ob gus‏ طف مق السانات الك يدا خن balle]‏ اة إل السات 
التفصيلية أو التسجيل الممستمر ويجري تطبيقها أحياناً على عينات وفي حالات قليلة على 
المجتمع بأكمله. وكانت البيانات المسجّلة انتقائية. تجمع من خلال التقارير أو الإبلاغ 
الذاتي على الورق أو على شريط مغناطيسي أو فيلم» في مكان وزمان معيّنين. وتميل البيانات 
إلى أن تكون منظمة للغاية في طبيعتهاء ومقتصرة على مجموعة من حقول البيانات ا لمحددة 
is aa‏ وكانت السجلات ضخمة ومكلفة في التخزين, مما يعني عدم الاحتفاظ الطويل 
الأمد بها إلا لكمية محدودة من البيانات» إضافة إلى كون الكثير منها إما عبارة عن عينة 
أو مشتقة. وحتى في الحالات التي قد تكون المراقبة فيها مستمرةء مثل الدوائر التلفزيونية 
alat‏ فقد تمتدٌ اللقطات نفسها على فترات زمنية طويلة تتعدى قدرة الشريط التسجيلي 
على تغطيتها ويجري في العموم إعادة التسجيل عليها بعد فترة معينة UU)‏ بعد سبعة 
أيام أو شهر). كما كان تحليل البيانات الناتجة من مختلف أشكال امراقبة المستخدمة 
يتم بواسطة مفسّر بشري إلا إذا جرى تحويلها رقمياً في وقت لاحق. ds‏ حين أن كميات 
البيانات التي تنتجها هذه المراقبة يمكن أن تكون ضخمة» وربما تستوفي واحدة أو اثنتين من 
الخصائص المرتبطة بالبيانات الكبيرة مثل قابلية الفهرسة والشمولية والعلائقية أو السرعة, 
إلا أنه لا يمكنها بأي حال أن تستوفي مجموعة الصفات امرتبطة بالبيانات الكبيرة كاملة. 

وفي حين لا تزال العديد من أنظمة المراقبة والحوكمة مستمرة في كونها جزئية وتناظرية, 
كان هناك تحرّك في الآونة الأخيرة لاستبدالها والتوسع فيها بنظائر رقمية مكافئة لها والتي 
تنتج الآن بيانات كبيرة. فعلى سبيل «JULI‏ يجري استبدال أنظمة الدوائر التلفزيونية 
ا مغلقة التماثلية الثابتة بأخرى رقمية متحركة حيث يمكن تغيير مجال الرؤية» والتقليل من 
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ا محددات على التخزينء وتعزيز التفسير البشري بتحليلات خوارزمية حسابية. مثل التعرف 
على الوجه أو dis o‏ المشي» كما هكن ربط مثل هذه البيانات مع قواعد بيانات أخرى. 
وهناء يوجّه تركيز الكاميراء وعمليات التحليل والتفسيرء من قبل مشغل بشريء وبمساعدة 
من البرمجيات. على سبيل «JULI‏ من ال ممكن مراقبة وضبط العديد من الكاميرات في 
غرفة عمليات الشرطة وربطها بسجل الحوادث الحية من أجل الاستجابة بكفاءة وتوجيه 
الموارد ا لمناسبة ممواقع معينة بشكل استباقي. bbg‏ في مراقبة الهجرة والجوازات» حيث 
يجري آنياً جمع معلومات الركاب التفصيلية وتدقيقها مع مختلف قواعد البيانات الأمنية 
والحدودية بشكل آني أو لحظي (Real-Time)‏ وإنتاج بيانات جديدة مثل المسح الضوثئي 
للصور الشخصية وبصمات الأصابع أو قزحية العين. وتستخدم العديد من الحكومات 
المحلية أنظمة إدارية لتسجيل مشاركات المواطنين مع خدماتها آنيا ورصد إن كان تعامل 
الموظفين مع أي قضايا قد g‏ ضمن أطر زمنية محددةء مع مراقبة مديري الإشراف للنظام 
لإعادة توجيه الموارد بحسب الحاجة. 

وتتكؤن بعض الأنواع الأخرى الأقل انتظاماً في إنتاج البيانات الكبيرة الموجّهة من: 
التصوير الجوي الرقمي عن طريق الطائرات أو الطائرات بدون طيارء أو الفيديو المكاني» 
أو الليدار (الرادار بتقنية الليزر) لكشف الضوء وتحديد مدى البُعدء أو الحرارية أو غيرها 
من أنواع الأشعة الكهرومغناطيسية للبيئات التي تمكن من الرسم المتحرك للخرائط الثنائية 
والثلاثية الأبعاد للمناظر الطبيعية المفهرسة مكانياً بشكل آني أو لحظي (Real-Time)‏ من 
خلال نظام تحديد المواقع العالمي (GPS)‏ وتنتج Jio‏ هذه الفيديوهات والمسوح بالأشعة 
كميات هائلة من البيانات de Ll‏ عالية السرعة. فعلى سبيل JULI‏ يمكن ماسح الليدار 
توليد مليون نقطة بيانيةء مع دقة بيانية تصل إلى بضعة سنتيمترات» مع إمكانية إجراء JS]‏ 
من مسح خلال الثانية الواحدة. إن وضع ماسح ليدري في مركبة وقيادتها في الأنحاء» أو 
الطيران به فوق منطقة معينة ينتج تمثيلا IB‏ الأبعاد مفضّلاً للغاية للتضاريس الطبيعية 
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البيانات الآلية :(Automated Data)‏ 
في حين وسّعت البيانات daz SLE‏ أنظمة ا مراقبة والحوكمة التقليديةء فقد حول إنتاج 
البيانات الآلية بشكل جذري كيفية ea]‏ البيانات وتوظيف استخداماتهاء ومكن من إنشاء 
أنظمة جديدة للتنظيم والإدارة التلقائية Dodge and Kitchin 2007a, Kitchin and)‏ 
«Dodge 2011‏ انظر الفصل العاشر). فمن خلال مجموعة من التقنيات الرقمية يتم إنشاء 
البيانات تلقائيا بواسطة مجموعة من النظم الآلية وبرقابة بشرية قليلة. وعلاوة على 
«e‏ يتم في الغالب معالجة وتحليل Jis‏ هذه البيانات تلقائيا وبشكل مستقلء إذ يجري 
العمل عليها بواسطة خوارزميات برمجية لتحقيق نتيجة معينة تهدف إلى تنظيم ظاهرة 
ما. وهناك طرق عديدة لإنتاج البيانات الآليةء بعضها قد يكون إنتاجه ثانويا عن النظام 

وليس من صميم عمله. 


: (Automated Surveillance) المراقبة الآلية‎ 

كما أصبحت تقنيات المراقبة رقمية بطبيعتها ومرتبطة بعضها ببعضء فقد Quo]‏ من 
ا ممكن أيضاً أتمتة جوانب متعددة لنظام المراقبة. وإضافة تقنيات جديدة, لتتبع أكثر فعالية 
وكفاءة في مراقبة وتتبع الاستخدام للأنظمة والأماكن المختلفة. Ass‏ قراءة العدادات 
الذكية مثالا على النموذج اليدوي من امراقبة التي غدت آلية بشكل متزايد. هناء يتم 
استخدام تقنية قراءة العداد (Automatic Meter Reading- AMR) Ui‏ مراقبة استخدام 
الآلة والتواصل معها دون الحاجة إلى القراءة اليدوية التقليدية )2013 (Hancke et al.‏ 
وعلاوة على «US‏ يمكنها القيام بهذه المهام بشكل متواصل مما هكن ا مورد من تتبع 
الاستخدام بشكل آني أو لحظي» وهذا له فائدة في مطابقة الطلب مع العرض وف العثور 
على أخطاء / تسريبات في النظام. كما أنها توفر وسيلة للقيام بالفوترة الآلية مما J‏ من 
نفقات التوظيف. وف كثير من الحالات» من الممكن للمستهلك أيضاً أن يراقب استهلاكه 
الخاص لخدمة معينة, مثل الكهرباء أو الغاز أو coll‏ فعلى سبيل المثال» هكن استخدام 
تطبيق للهاتف الذي للاتصال بعداد عن بعد باستخدام تقنية اتصال المجال القريب على 
سبيل الالء البلوتوث» ومن ثم تغبير الاستهلاك تبعا لذلك. 
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وبالمثلء تعزز أنظمة إدارة المرور من القدرة على تنظيم وضبط السائقين من خلال 
الاستفادة من تقنية التعرف VI‏ على el‏ لوحات امركبات Automatic Number Plate)‏ 
.(Recognition- ANPR) (Dodge and Kitchin 2007a‏ فهناء تمسح الخوارزميات 
بيانات الصور من الكاميرات الرقمية للكشف عن لوحات الترخيص. ومن «daz‏ يمكن 
استخدام هذه المعلومات لتتبع المركبات خلال عبورها على طرقات المدينة وتقديم مدخلات 
إلى نظم النقل الذكية «(Intelligent Transportation Systems- TTS)‏ ومن ägo‏ 8521« 
مكن إحالة هذه البيانات إلى قاعدة بيانات مالكي المركبات لإدارة الغرامات والعقوبات 
امتعلقة بالمخالفات ا مرورية. فعلى سبيل امثالء بالنسبة للمثال السابق» يتم فحص لوحة 
الترخيص لجميع المركبات الداخلة إلى منطقة ele JI‏ المروري في لندن ومطابقتها مع قاعدة 
بيانات تلك المركبات التي سددّت رسوم الازدحام» أما تلك التي لم تسدّد خلال فترة أربع 
وعشرين ساعة فيتم تغريم مالكيها تلقائيا من خلال عملية الإدارة الآلية (يتمتع النظام 
باستقلالية في إصدار الغرامات دون الحاجة لرقابة بشرية). ويمكن للنظام ELL‏ استخدام 
كاميرات السرعة لإصدار قسائم تجاوز السرعة للسائقين المخالفين. 


وفي حالات أخرىء تم تسهيل المراقبة الآلية من خلال استخدام رموز الهوية المقروءة 
آليا لتسجيل ماهية الأنشطة المريبة/ المجهولة على شبكة المراقبة. فعلى سبيل JELI‏ تم 
استبدال التذاكر الورقية التي يتزايد تبادلها في السفر على نظام النقل من غير حامليها 
بالبطاقات الذكيةء التي ينبغي التدقيق عليها لدخول وخروج المحطات ووسائل النقل. 
ويتم إنشاء سجل عند نقاط ا مسح ومن ثم يمكن تتبع كل حركات حاملي البطاقات الذكية. 
وفي حالة نظام النقل في لندن» فإن استخدام بطاقات أويستر (Oyster)‏ يعني أنه من 
ا ممكن تتبع الرحلات الفردية عبر نظام الحافلات والسكك الحديدية اللمستخدمة من قبل 
مليوني راكب يومياً )2012 (Batty etal.‏ وبالمثلء من ا ممكن الآن ا مراقبة التلقائية 
لأشكال متنوعة من الخدمات العامة المقدمة التي كان يجري رصدها عرضاء مثل gaz‏ 
النفايات. من خلال استخدام رقائق تحديد الهوية باستخدام موجات الراديو (RFID)‏ التي 
تثبّت على حاويات النفايات ويتم مسحها عن بعد عند نقاط الجمع. وأصبح من الممكن 
قياس كميات التخلص من النفايات باستخدام مقاييس مرفقة بمجموعة مركبات وتحميل 
الأسر بصورة فردية تكلفة التخلص من النفايات على ساس الحجم بدلا من الرسم الموحد 
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دون تمييز. كما أصبح من الممكن أيضا الحصول على فهم مفضّل لأماط التخلص من 
النفايات داخل منطقة ما وإعادة تخطيط طرق وأوقات الجمع. 


الأجهزة الرقمية :(Digital Devices)‏ 
كما سبق الإشارة إليهء كان هناك نمو هائل في عدد الأجهزة الرقمية ا مستخدمة حول 
العام والتي تساعد على تسهيلء وتعزيزء وإدارة العديد من جوانب الحياة اليومية. فهذه 
الأجهزة لا تقوم بمجرد معالجة البيانات الرقمية والتعليمات فحسب. ولكنها تنتج بيانات 
رقمية بشكل نشط وكوظيفة أساسية لها أو ثانوية» أو الاثنين على حذ سواء. ومن الأمثلة على 
الأجهزة التي تنتج بيانات رقمية كوظيفة أساسية: الكاميرات» وأشرطة الفيديوء وا مراقيب 
ووحدات تحديد المواقع (GPS)‏ وأشكال مختلفة من المعدات الطبية مثل كاميرات المنظار» 
وا ماسحات بالموجات فوق الصوتية» وموازين الحرارة a JI‏ إلخ. أما أمثلة الأجهزة التي 
تنتج بيانات رقمية كوظيفة ثانوية» فتشمل الهواتف النقالة ومستقبلات البث التلفزيوني 
عبر الكابل أو الأقمار الصناعيةء والتي تنتج بيانات متعلقة بكيفية استخدامها (على 
سبيل JULI‏ الوقت» المكان. الشخص اممتصل / القناة المشاهدة). مع البيانات المتصلة 
بها والتي جرى جمعها في سجلات يتم إرسالها إلى أطراف ثالثة (مثل مصنعي الأجهزة 
ومقدمي الخدمات). أما الأمثلة على الأجهزة التي تنتج البيانات الأساسية والثانوية معا 
فتشمل الهواتف الذكية التي يمكن استخدامها لتسجيل الملاحظات. والتقاط الصورء وكتابة 
البريد الإلكتروني والتعليقات على وسائل التواصل الاجتماعيء ...إلخ» بالإضافة إلى تسجيل 
استخدام مختلف التطبيقات. وتشكل هذه الأجهزة سلالة جديدة من الكائنات» 5 تسمى 
لوجكتس )2011 (Logjects) (Kitchin and Dodge‏ - كائنات ترصد وتتبع تاريخ 
استخدامها الخاص. وف كثير من الحالات» يكون من الممكن تسجيل موقع هذه الأجهزة. 
فالهاتف الجوال والهواتف الذكية يمكن تتبّعها من الفضاء عن طريق التثليث (حساب 
امقلقاة) غير خوائات lahai‏ عن طريق مستقبلات تحديد المواقع المدمجة فيهاء 
بالإضافة إلى مراقبة السرعة والاتجاه من خلال ال مدوار (Gyroscopes)‏ ومقاييس التسارع 
(Accelerometers)‏ والبوصلات (Compasses)‏ على شكل أقراص dolgh ui‏ أو أجهزة 
ملاحة بالأقمار الصناعية أو أي أجهزة أخرى. وعلاوة على ذلك. فإن العديد من هذه 
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الأجهزة يمكن أن تتفاعل بشكل مستقل بعضها مع بعض وتقوم بتبادل البيانات. ومع تكاثر 
الأجهزة المعقدة لكافة المهام وي كل الأماكنء ez‏ إنتاج المزيد واطمزيد من البيانات الغنية 
بالبيانات الوصفية القابلة للفهرسة. مما يتيح تحليلا أكثر تطورا واستحداث إستراتيجيات 
ومنتجات حديدة él‏ على البيانات. 


البيانات المستشعرة :(Sensed Data)‏ 
تعد المستشعرات والمحركات من أنواع الأجهزة الرقمية. وهي ما يمكن أن تكون ضمنا 
أو less‏ من هياكل مختلفة لقياس مخرجات معينة مثل مستويات الضوء والرطوبة» ودرجة 
الحرارة» والغاز واممواد الكيميائية» واممقاومة الكهربائيةء والصوتيات» وضغط الهواء والحركة 
de pls‏ ...إلخ. وتعد أجهزة الاستشعار وا محركات صغيرةء وغير مكلفة في العموم» ويمكنها 
إنتاج تيار مستمر من البيانات» ويمكن أن تكون سلبية وتقرئ بواسطة الماسحات الضوئية 
أو کن أن 0953 45 Gus caso dla‏ المانات على قرات متعظطية غر ف كات EE‏ 
المحلية أو الواسعة. أو قد يكون لديها قدرة الاتصال من خلال حقل الاتصالات القريب 
(NFC)‏ والذي eux‏ الاتصالات في اتجاهين )2013 .(Hancke et al.‏ وبوضعها على جسر 
مكن للمستشعرات أن تقيس وتتواصل لحساب معدلات التآكل (عن طريق قياس ال مقاومة 
الكهربائية) ومقدار الضغط على مواد البناء باستخدام أجهزة استشعار الانبعاثات الصوتية 
(للكشف عن انتشار الموجات الصوتية) وأجهزة استشعار التخصّر المغناطيسي (للكشف عن 
تغيرات في الحث ا مغناطيسي). ومن ثم يقلل ذلك من الحاجة إلى التفتيش اليدوي ا مكلف 
.(Hancke etal. 2013)‏ وبال مثلء ممكن للمستشعرات داخل نظام eL‏ قياس نوعية 
ا مياه وضغطهاء ومقدار تدفقهاء وتمكين الإدارة الآنية وصيانة الأنابيب لحظة بلحظة. وعلى 
ا مركبات» يمكن للمستشعرات رصد حجم العملء والإجهاد, والتضاريس. فشركة هيتاشي 
تستخدم هذه اللمجسات لرصد مركباتها الثقيلة المعقدة والمكلفة, وكذلك تفعل الشيء نفسه 
شركة النقل السريع (UPS)‏ مع أسطولها من عربات النقل والشاحنات بحيث توظفها 
لتشغيل خدماتها بكفاءة وبصورة استاقية Plumridge 2012; Mayer-Schonberger)‏ 
(and Cukier 3‏ ومن خلال ربط رقائق تحديد الهوية باستخدام موجات الراديو 
(RFID)‏ بالمنتجات أصبح من الممكن رصد وتتبع حركة الوحدات الفردية من gall‏ 
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أو ا مزرعة إلى المستهلكء والحذ من السرقة والهدر. وبالمثلء تحتوي بطاقة الضريبة على 
شريحة تحديد الهوية باستخدام موجات الراديو التي تتواصل مع قارئ ترددات راديوي 
على حواجز تحصيل الرسوم» مما يؤدي إلى سرعة أعلى في حركة المركبات والدفع YII‏ 
بالإضافة إلى حساب معدل حركة المركبات أو عدد مواقف السيارات امتاحة لإدارة حركة 
ا مرور. كما تثبّت رقائق تحديد الهوية باستخدام موجات الراديو على الحافلات والقطارات 
والتي تتواصل مع قارئ الموجات الراديوية على طول مساراتها مما يجعل من الممكن تتبع 
موقع المركبات في أي EER‏ 

كما يمكن إنشاء شبكة استشعار كثيفة من خلال توزيع العديد من أجهزة الاستشعار 
وربط البيانات التي تنتجهاء مما يتيح رصد أوضاع مختلفة عبر نظام أو مكان ما. وقد 
توالت الأمثلة على هذه الشبكات وأجهزة الاستشعار في مدينة سانتاندر (Santander)‏ في 
إسبانيا كجزء من مشروع المدينة الذكية «(SmartSantander)‏ وفيه 12000 من أجهزة 
الاستشعارء وتتكون من خمسة أنواع» تم توزيعها بشكل إستراتيجي في جميع أنحاء المدينة 
لقياس الضوضاء والحرارة. ومستويات الإضاءة المحيطة» وتركيز غاز أول أكسيد الكربونء 
والأماكن اللفواقرة لوقوف السيارات وركها )2013 (Bielsa‏ وترقظ الجيرة les eau‏ 
من خلال الاتضالات الاسلكية وتوف decas]‏ عبر (OTAP) i‏ هما مكق من lina:‏ 
وتحديث برمجياتها عن بعد )2013 .(Bielsa‏ كما يجري تطوير وادي بلان آي (PlanIT) à‏ 
في البرتغال» وهو في الوقت الحاضر تحت الإنشاء ومصمّم لإيواء 225 ألف clau‏ ويهدف 
إلى إنشاء بيئة قائمة على أكثر من 100 مليون جهاز استشعار مدمج فيها والتي سوف تنتج 
بيانات لرصد مجموعة متنوعة من البنى التحتية والبيئات )2012 .(Marchetti‏ وهكذاء 
dad‏ إل امترات برتقا عنصا اماما في التطورات التي تشهدها المدينة الذكية. 


بيانات المسح الضوئي :(Scan Data)‏ 

بالإضافة إلى الأجهزة الرقمية وأجهزة الاستشعار التي تنتج البيانات بشكل نشط والتي 
هي جزء من شبكة إنترنت الأشياءء من ا ممكن رصد وتتبْع الكاضات الأغرى La;‏ من خلال 
رموز الهوية المقروءة LT‏ وقد تجاوز استخدام الرمز الشريطي (Barcode)‏ قطاع البيع 
بالتجزئة ليشمل السلع المصنعة والاستمارات الرسميةء كما وضعت العديد من ال منظمات 
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الكبرى والقطاعات الصناعية نموذجها الخاص من الرمز الشريطي ومعابيرها لتخصيص 
الأرقام )2005 .(Dodge and Kitchin‏ وتمثل البيانات في الرموز الشريطية ثنائية الأبعاد 
أا Ll‏ معموفةمق الشاط diss LI‏ ومكن ا مهد اها اقهدود كاقن كل فرين: 
وتستخدم بعض خدمات البريد هذه الرموز الشريطية الثنائية الأبعاد لتمكين المتابعة 
والتعقيب للرسائل والطرود البريدية بشكل فردي. «Jib‏ تحتوي الشرائط ا مغناطيسية 
المثبتة على بطاقات الائتمان والولاء وبطاقات السماح بالعبور من خلال الأبواب على معرّف 
فريد يختص بصاحب البطاقة التي يتم قراءتها عند تمريرها على القارئ. وقد جرى استبدالها 
لاحقاً برقائق إلكترونية هكن التحقق من البيانات التفصيلية فيها باستخدام الأرقام السريّة 
الشخصية لمستخدميها. كما يتم إنتاج البيانات الخاصة بالاستعمالء في كل مرة يجري فيها 
مسح الرمز الشريطي أو الشريط المغناطيسي أو الرقاقة الإلكترونية, متضمناً ذلك أين ومتى 3& 
الاستخدام ولأي غرض. وبالنظر إلى أن الغرض من هذا gabl‏ في كثير من الحالات هو لشراء 
السلع. فهي توفر وسائل مهمة لإنتاج معلومات عالية الدقة والتفصيل للصفقات المبرمة. 


البيانات التفاعلية :(Interaction Data)‏ 
على الرغم من أن بعض مستخدمي الإنترنت ينظرون إليها باعتبارها وسطاً مجهول 
ا معام إلى Xe‏ ماء إلا أن كل تفاعلات المستخدمين الجارية عبر شبكات المعلومات والاتصالات 
نتج بيانات تفاعلية. وحقيقة فإن إنتاج البيانات هو قائم بطبيعته على العديد من أشكال 
الاتصال والاستخدام في شبكات تقنية المعلومات والاتصالات. على سبيل المثال» يتعقب 
مزودو خدمات الإنترنت المواقع التي تتصل بها حسابات المستخدمين الفردية والأجهزة, 
وتستخدم العديد من المواقع» وخاصة مواقع الشركات» سجل التتبع وتعريف الارتباط 
للمتصفح (كوكيز (Cookies‏ لإنتاج بيانات النقر (اختيارات gi (eue asl‏ كيفية تنقل 
المستخدم خلال الموقع على شبكة الإنترنت وما الميزات التي جرى اختيارها. وبشكل عام 
تستخدم مثل هذه البيانات لمراقبة كيفية slo]‏ ا موقع الإلكتروني» وإجراء أبحاث عن السوق 
guig‏ مسار إنتاجية الموظفء مع إمكانية بيع هذه البيانات إلى أطراف أخرى. ويتم 
إنشاء بيانات النقر هذه بصورة تلقائية ما م يعد المستخدم تطبيق المتصفح لعدم قبول 
ملفات تعريف الارتباط (وهذا قد يضعف استخدام الموقع). وبالمثل. يتم تخصيص رموز 
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تعريفية فريدة في جميع الصفقات المالية القائمة على تكنولوجيا المعلومات والاتصالات» 
سواء الخدمات المصرفية الشخصية الإلكترونية» أو عمليات سحب أموال من أجهزة الصراف 
الآليه أو عمليات المتاجرة في الأسهم» ويجري تخزين بيانات هذه المعاملات تباعاً. وتحتوي 
جميع رسائل البريد الإلكتروني على رؤوس في مقدمة حزم بياناتها والتي تقوم بتحديد البريد 
الإلكتروني بشكل فريد. وتحتوي على معلومات تشمل المرسل والمتلقيء والخوادم والأجهزة 
المستخدمة. وعلى المنوال نفسه» يتم تمييز جميع coU‏ الهاتفية بمعلومات المتلقي 
i LAU‏ ووقت إجرائها ومدة بقائهاء وما إذا كان الهاتف محمولاً وا موقع. ونتيجة لذلك 
يتم إنشاء كميات هائلة من البيانات بشكل روتيني بشأن التفاعلات الحاصلة عبر شبكات 
Laos] iS‏ العلومات. والاتضالات: 


البيانات التطوعية :(Volunteered Data)‏ 
على النقيض من الممراقبة الموجهة إلى الأشخاص أو الأشياء من قبل الأفراد «calls‏ 
أو تلك التي يتم التقاطها تلقائيا باعتبارها ميزة متأصلة لجهاز أو نظام ماء فإن كثيراً 
من البيانات الكبيرة يتم إنتاجها من قبل الناس بشكل تطوعي فعال. ففي مثل هذه 
الحالات» ينتج الأفراد البيانات ويقومون بإدخالها للعمل على الاستفادة من خدمة 
(مثل وسائل التواصل الاجتماعي)» أو المشاركة في مشروع جماعي مثل مشروع خريطة 
الشارع المفتوح (http://www.openstreetmap.org)‏ أو موسوعة الإنترنت ويكيبيديا 
.(https://www.wikipedia.org)‏ ويسمى مثل هذا العمل بالإنتاج الاجتماعي 
(Prosumption)‏ حيث Jeu] h kas‏ الإنتاج والاستهلاك Lye‏ بعضها في بعض» 
مع اكتساب الأفراد دوراً في إنتاج الخدمة أو المنتج الذي يستهلكونه Ritzer and)‏ 
.(Jurgenson 2010‏ فعلى سبيل «JUL‏ يجري إنتاج واستهلاك محتوى مواقع التواصل 
الاجتماعي في ذات الوقت من قبل الأفراد المستخدمين عن طريق إدخال التعليقات, 
تحميل الصور ومقاطع الفيديوء وا لمشاركة في مناقشة وتبادل ا مشاعر («الإعجاب» 
أو «عدم الإعجاب» للشيء). ومن خلال جهودهم الجماعيةء يُنشئ الأفراد المنتجات 
والخدمات التي يشاركون فيها ويضيفون قيمة لها ويستخرجون القيمة منهاء بحسب ما 
أشار إليه )2006( Benkler‏ بمصطلح «ثروة الشبكات». وفي معظم الأحوالء يقوم أفراد 
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الإنتاج الاجتماعي بهذا العمل الإضافي Llig‏ مادي قليل أو دون أي تعويضء وذلك ls]‏ 
للحصول على متعة المهمة» أو الشعور بالسلطة. أو توفيرهم JU‏ والوقت مع انخفاض 
تكلفة الخدمة والتي غالبا ما تصبح أكثر مرونة بطبيعتها مثل الخدمات المصرفية عبر 
الإنترنت أو الحجز في رحلة طيران من المنزل. في المقابلء يتلقى مزوّد الخدمة أو متاجر 
yel‏ عملا دون تكلفة با اة إل colas‏ والآراء واالعرفة واكتساب PE‏ 
ومعلومات ذات قيمة من خلال القرب أكثر من العملاء / الزبائن والقدرة على تسييل 
بياناتهم )2013 .(Ritzer and Jurgenson 2010; Dodge and Kitchin‏ فبعض أشكال 
الإنتاج الاجتماعي هي أقرب إلى الخدمة الذاتية ومقيدّة بطبيعتهاء مع m‏ أفرادها بالأعمال 
التي كانت مسندة إلى موظفين, في حين أن البعض الآخر أكثر انفتاحا وتفاعلية. dag‏ 
سيتم e‏ مناقشة خمسة أشكال للبيانات التطوعية باختصار: (Transactions) CEET‏ 
ووسائل التواصل الاجتماعي «(Social Media)‏ واطراقبة الحية «(Sousveillance)‏ 
والتعهيد الجماعي (Crowdsourcing)‏ وعلم اطواطنة (Citizen Science)‏ 


(Transactions) المعاملات‎ 


يتطلب الشراء عن طريق الإنترنت من المشتري إدخال البيانات الشخصية له فيما T‏ 
عملية الدفع والعتوان IESU ais‏ الوضقية الكبرورية 5:81 Use EE‏ 
عملية للتحقق وتبادل المعلومات ولكن أيضا لمعرفة ا مزيد عن المستهلك. وعادة ما تكون 
التفاعلات في Jio‏ هذه التبادلات محدودة إلى do do‏ وتقتصر على اختيار ماهية بنود 
الشراء. والعديد من حقول البيانات الإلزامية لوضع اللمسات الأخيرة وإتمام عملية الشراء. 
وبعد تبادل المعلومات» من الممكن طلب المزيد من المعلومات من المستخدمينء إما لتقييم 
أداء ا موقع وخدمة العملاءء أو لتصنيف ومراجعة بيانات البند الذي تم شراؤه. وتضيف 
بيانات المراجعة هذه قيمة للموقع من خلال اقتراح كيفية تحسين التصميم وكذلك تزود 
ا مستهلكين الآخرين بردود الأفعال (Feedbacks)‏ عن مدى جودة وكفاءة المنتجات. فعلى 
مواقع إلكترونية (http://www.tripadvisor.com) Jis‏ کن لأفراد الإنتاج ا مجتمعي 
تقييم واستعراض الفنادق وخدمات السفر الأخرىء مثل البيانات التي يجري le go le‏ 
على الموقع عن حركة os d‏ وبث الإعلانات والإشارة إلى مواطن الربح المحتملة» مما يكون 
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له تأثين ملحوظ فى اختيارات المسافرين الآغرين. كما يوفر الموقع بياثات مقيدة حول 
الشخص الذي تطوّع لإجراء الاستعراض والتقييم» مثل خيارات أسلوب الحياة والإنفاق 
خلال السفر التي يمكن تسييلها ماليا عن طريق بيعها إلى أطراف ثالثة. وبا مثلء تتطلب 
تعبئة النماذج الإلكترونية الحكومية من المواطن تقديم معلومات للموقع بشكل تطوعي. 
وهناء يكون هنالك تبادل للبيانات يتعدى حدود عملية الدفع للمبالغ النقديةء فبعض 
البيانات الإضافية الأخرى يمكن أن تكون مرتبطة بالمعاملات. مثل بيانات مسار النقر على 
الصفحات ومعلومات بطاقة الولاء مما يتيح بناء ملف auus‏ للشخص هكن البناء عليه مع 
مرور الزمن أو يتم ربطه مع مصادر البيانات الأخرى مثل بيانات التوزيع الجغرافي للسكان. 


التواصل الاجتماعي :(Social Media)‏ 
قبل العام ٠٠٠٠م‏ كانت شبكة الإنترنت إلى d‏ كبير lb us‏ للبت الإعلامي هكن من 
خلالها للناس تقديم المعلومات أو شراء البضائع. وكانت هناك لوحات الإعلانات والقوائم 
البريدية التي يستطيع الناس من خلالها التواصلء ولكنها كانت قائمة على استخدام النصوص 
hä‏ ومحددة بطريقة عرض بدلاً من كونها وسيلة مفتوحة وعامة. وبينما هكن للأفراد 
إنتاج أشكال أخرى من ال محتوى مثل صفحات الويب» إلا أن ذلك يتطلب &jlall‏ لإنشاء 
مثل هذه الصفحات وشراء اسم النطاقء وكانت هذه الصفحات ثابتة إلى do‏ كبير وينبغي 
تحريرها بشكل رئيسي على الطريقة اليدوية ليجري تحديثها. واعتباراً من العام EYE‏ 
وعلى الرغم من ذلك بدأت طبيعة شبكة الإنترنت بالتغيّر لتصبح أكثر تفاعلية وتشاركية 
ودينامية, وقد تم الإشارة إلى هذا التحول على أنه الانتقال من إصدار شبكة الويب الأول 

(Web 1.0)‏ إلى الإصدار الثاني )2005 (Web 2.0) (O'Reilly‏ . 
وعوضاً عن محتوى الويب الذي يجري تقدهه إلى or‏ كبير من قبل ا مختصين ومصممي 
المواقع الإلكترونية, فقد أصبح لأي شخص إمكانية إنشاء محتوى يمكن تحديثه بشكل 
مستمر. وعلاوة على EUS‏ يمكن الوصول إلى هذا المحتوى والتفاعل معه من خلال 
معو عن مكو علا مسن eost)‏ :الموائف SM‏ ولاج اللفسية Vus‏ من مجه 
تصفح اللعلومات أو تقبيدها في E‏ نسبياء أصبح هن اللمكن ااناس الشاركة 
بسهولة وبشكل فعال في إنتاج عاط الإنترنت وتصميم وتحرير المحتوىء والإسهام بحرية في 
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الخدمات التي تتبادل المواد مع الآخرين. وفي حين تم اعتبار الإصدار الأول لشبكة الويب 
(Web 1.0)‏ وسطاً للقراءة فقطء فإن الإصدار الثاني لشبكة الويب )2.0 (Web‏ هو وسط 
للقراءة والكتابةء Sce‏ للناس من خلاله إضافة قيمة للمواقع عندما يقومون باستخدامها. 

وتميل مواقع الإصدار الثاني من الويب وخدماتها إلى التركيز على النشر من العديد - 
إلى - العديد. والتواصل الاجتماعي» وتوفير معلومات أكثر ثراء واتساقاً. وتشتمل الأمثلة 
على خدمات الشبكات الاجتماعية على سبيل JULI‏ الفيسبوك وتويتر؛ والصور ومواقع 
مشاركة الفيديو على سبيل JULI‏ فليكر ويوتيوب؛ واممدونات؛ وعمليات ال مزج باستخدام 
واجهات برمجة التطبيقات المفتوحة (APIs)‏ لدمج البيانات من jolas‏ مختلفة لإنشاء 
تطبيقات جديدة على سبيل «JULI‏ فورسكويرء وييلب (Yelp)‏ وتعتمد هذه المواقع كلها 
على المشاركة الفعالة من جمهور متحمس لتبادل المعلومات حول حياتهم والقيام بأعمال 
من قبيل الكتابة» التحرير» التطبيق» التعديل» النشرء dS Ll‏ الوسم التواصلء ... إلخ 
(Beer and Burrows 2007)‏ وعند القيام بذلك. فهم لا يتطوعون بالعمل فقطء ولكن 
بالكثير من البيانات عن أنفسهم.: متضمنا ذلك الملفات التعريفية, الصورء ال مواقع» الآراء 
التفضيلات. القيم» وشبكة اتصالاتهم الاجتماعية. ولأنه قد جرى تملك هذه المواقع من 
قبل مجموعة شركات تأسست حديثاء فإنه يجري تداول البيانات في أيدي مملوكة للقطاع 
الخاص والتي تسعى بدورها لإنتاج نماذج جديدة من تراكم رأس JUI‏ عن طريق استخراج 
القيمة منها (انظر الفصلين الثاني والسابع). 


المراقبة الذاتية :(Sousveillance)‏ 

ا مراقبة الحية هي الرصد الذاتي وإدارة صحة الفرد الشخصية وحياته من خلال التقنيات 
الرقمية الحميفة ule‏ سييل «JÉLI‏ مغدات اللياقة البدنية: والخوسية القابلة اردان 
لتسجيل البيانات المتعلقة بالفرد )2003 (Aes (Mann et al.‏ النقيض من امراقبة 
الإشرافية (Surveillance)‏ والتي يتم فيها مراقبة الفرد من موقع خارجي بواسطة شخص 
آخرء يجري توظيف وضبط امراقبة الذاتية عن وعي وإدراك الفرد لتحقيق الذات» وتوفير 
منظور داخلي 5l‏ عن حياته. وعلى مدى العقد الماضي» تطورت حركة المراقبة الذاتية من 
أناس يراقبون ويسجلون بنشاط بياناتهم الشخصية والتي تُعرف أيضاً باسم حركة القياس 
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الكمّي للذات أو التتبع الذاتي (Quantified Self) Las‏ وبشكل ele‏ يراقب الأفراد جوانب 
الصحة واللياقة البدنية» ويجمعون بيانات الاستهلاك (على سبيل «JUL‏ المواد الغذائية / 
السعرات الحرارية)» والحالات الجسدية Jis)‏ ضغط الدم والنبض)ء والحالات العاطفية 
(على سبيل JELI‏ المزاج ومستويات الإثارة) والأداء (على سبيل JULI‏ أميال المشي/ الركض 
/ الدوران المقطوعة, وعدد ساعات النوم» وأنواع النوم)ء بالتعاون مع عدد من الشركات 
التي eas‏ التقنيات والخدمات المرتبطة بالمراقبة الذاتية. وتشمل شركات مراقبة الأنشطة 
الرياضية والنوم» على سبيل المثالء شركات من أمثال فت بتء ونايك بلس» فيول باند 
وحوبون (Fitbit, Nike+, Fuelband, and Jawbone)‏ وا لتي تعمل على مزامنة البيانات 
الناتجة مع تطبيقات متابعة وتعقب تسمح للمستخدم برصد وتحليل بياناته الشخصية. 
ولا يجري بالضرورة مشاركة البيانات التي E‏ إنتاجها على نطاق أوسع. على الرغم من 
إمكانية حدوث ذلك ولكن يجري مشاركتها مع الشركات المزوّدة للخدمة: مما يوفر لهم 
اطلاعا نافذا على البيانات الشخصية. 


وتُعد هذه التقنيات في المرحلة الأولى من التطوير وهناك رؤى أكثر شمولاً لتسجيل 
بيانات الحياة (Life Logging)‏ التي تعمل على إنشاء سجل رقمي موحد لخبرات الأفراد. 
من خلال جمع متعدد الطرق عبر أجهزة استشعار dia)‏ وتخزينها بشكل دائم كأرشيف 
شخصي متعدد الوسائط )2003 (Mann et al.‏ وذلك مع عدد من نماذج الأبحاث التي 
يجري تطويرها Ul‏ وتهدف سجلات بيانات الحياة إلى إنشاء سجل متصلء وقابل للبحث 
والتحليل لماضي الشخص الذي يشمل كل عملء أو كل حدث أو كل محادثة, أو كل 
موقع تمت زيارتهء أو أي تعبير مادي متصّل بحياة الفرد. فضلاً عن الظروف الفزيولوجية 
داخل الجسم والأوضاع الخارجية المحيطة به (على سبيل JEL‏ الوجهةء ودرجة الحرارة 
ومستويات التلوث) (Dodge and Kitchin 2007b)‏ - "أي مجمل المعلومات التي تتدفق 
خلال حياة الإنسان" )85 :2003 .(Johnson‏ ومن الواضح أن إنتاج هذه السجلات عن 
الحياة يثير عدداً من الأسئلة بشأن الخصوصية» وملكية البيانات المنتجة, وطريقة استخدام 
هذه البيانات (Dodge and Kitchin 2007b)‏ 
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التعهيد الجماعي :(Crowdsourcing)‏ 

التعهيد الجماعي هو الإنتاج المشترك لوسائط الإعلام: والأفكارء والبيانات من خلال العمل 
التطوعي من قبل العديد من الناس لحل مهمة معينة. وبينما هكن القول بأن محتوى وسائل 
التواصل الاجتماعي هي نتاج تعهيد جماعي معنى أنه يتم الحصول عليه من قبل عدد كبير 
من الناسء إلا أن الغرض من هذه المحتوى موزع وواسع الانتشار ويفتقر إلى التركيز. فبدلاً 
من ذلك يركز التعهيد الجماعي على الإنتاج التعاوني للمعلومات وإنشاء حلول لقضايا معينة 
من خلال الاعتماد على ASUI‏ والمعارفء والمهارات» والعمل التوافقي والجماعي لحشد من 
الناس )2008 .(Howe‏ وقد بين )2008( Howe‏ أن هناك أربعة تطورات تدعم نمو التعهيد 
الجماعي: نهضة الهواة (بحسب المعايير المهنية في الغالب)» وظهور حركة البرمجيات مفتوحة 
المصدرء وزيادة وفرة أدوات الإنتاج خارج إطار الشركات dial‏ وصعود مجتمعات محلية 
حيوية ومنظمة وفقاً لاهتمامات الناس وميولهم على شبكة الإنترنت» فهذه التطورات 
مجتمعة مكنت من تجميع موزع ود هقراطي للأفكار والأدوات والمواد. وهناك ثلاثة أنواع 
رئيسية من التعهيد الجماعي التي تعمل في الوقت الحاضر: تلك التي تتتج حلا بشكل 
جماعي على سبيل «JULI‏ خريطة الشارع المفتوح «http://www.openstreetmap.org)‏ 
ويكيبيديا t(https://www.wikipedia.org)‏ وتلك التي تستخدم الجمهور لتقييم حلول أو 
منتجات متعددة على سبيل «JULI‏ موقع شركة أمازون «https://www.amazon.com)‏ 
ومستشار الرحلات t(https://www.tripadvisor.com)‏ وتلك التي تسعى إلى حل واحد 
أو أكثر من الجمهور على سبيل «JULI‏ إتوسنتف «/https://www.innocentive.com)‏ 
والملتقيات المكثفة مطوري البرمجيات (Hackathons)‏ 


وبخصوص النوع الأولء أصبح إنتاج المعلومات (خريطة مفتوحة المصدر, موسوعة قابلة 
aside‏ الا doen‏ كا وفيا وما من إنتاج الأفراد. مع إعطاء المشاركين 
الحقوق والتسهيلات لتعديل وتنقيح وإسهاب الشرح لمساهمات الآخرين Benkler)‏ 
6).. فمن خلال العمل عبر شبكة الإنترنت يمكن لأي أحد له قدرة النفاذ إليها من أن 
يسهم ويضيف إلى مجمّع الخبرات المحتملة ونطاق المشاريع مقابل تكلفة أقلء وضمان 
ممارسة مختلف وجهات النظر والتقنيات على المشروع )2011 (Weinberger‏ وق الواقع. 
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فإن إنتاج خريطة مفصّلة للعالم أو موسوعة شاملة مع عدد قليل من اللهنيين هي مهمة 
صعبة ومكلفة. وببساطة شاقة للغاية بالنسبة طمجموعات صغيرة من المتطوعين. ولكن 
بالنظر إلى آلاف المشاركينء هكن تجزئة المهمة عليهم وحلها. وسيكون المقابل الذي سيجنيه 
ا مشاركون هو إنتاج بيانات مفتوحة المصدر خالية من حقوق الطبع والنشر والرخص 
المكلفة LS)‏ هو الحال مع بيانات الوكالة الوطنية لرسم الخرائط) Dodge and Kitchin)‏ 
2013( وبالمثلء ممكن لشركة أمازون وغيرها من شركات التجزئة على الإنترنت» من خلال 
تمكين المستخدمين من استعراض الممنتجات التي يشترونهاء استخدام قوة الجماهير ل مراجعة 
ومشاركة آرائهم حول هذه المنتجات. كما أن الفائدة التي تعود على المشاركين هي تبادل 
الرأي فيما يتعلق بالمزايا النسبية للسلع والخدمات. 

ويعد استخدام المسابقات لتحفيز الجماهير على اقتراح حلول مقابل جائزة من أشكال 
التعهيد الجماعي الخاصة والذي تستخدمه بعض الشركات لتقديم الخبرات والأفكار 
lös .(Weinberger 2011)‏ عن اللجوء للمناقصات والاستعانة مجموعة محدودة من 
الخبراء المحتملين. تفتح شركات مثل إنوسنتف (Innocentive)‏ وتوب كودر (TopCoder)‏ 
المشكلة من خلال الإعلان عنها لأي شخص مهتم» وتقدم في العادة من عشرة آلاف إلى مئة 
آلف ذولان bles‏ 161 من ذلك بك slo‏ حلول SUE‏ اماف دهط ركو EE‏ 
هو مصدر الحلء ولكن لا يعمل الأفراد بعضهم مع بعض بشكل جماعيء وتكون الفائدة 
بالنسبة للشركات هي خيارات الحل المقدمة وللمشاركين هي العائد المالي إذا تم اختيار 
الحل الخاص بأحدهم. وعلى نحو مماثل» تسعى مسابقات بيانات التطبيقات المفتوحة 
التي تعقدها المجالس البلدية إلى تقديم مكافآت أكثر تواضعاً مقابل تطبيقات أكثر فائدة 
وإثارة للاهتمام. ويمكن لهذه المسابقات أن تأخذ شكل الملتقيات المكثفة لمطوري البرمجيات 
(Hackathons)‏ التي يعمل الناس فيها معا في فرق لتطوير حلول تطبيقات» وعادة ما 
تمتد على مدى يوم أو خلال عطلة نهاية الأسبوع. وتتمثل الفائدة العائدة على البلدية في 
استخدام بياناتها من أجل الصالح العام» وشهرة المواطنينء والمشاركة المدنية. 
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:(Citizen Science) المواطنة‎ e 
علم المواطنة هو شكل من أشكال التعهيد الجماعي حيث تعمل مجتمعات أو شبكات‎ 
هناء‎ .(Goodchild 2007: 218) من المواطنين بصفة مراقبين في بعض مجالات العلوم‎ 
والقياسات التفصيلية‎ diuo ye] يقوم الناس بإنتاج وإعداد ومعالجة الملاحظات العملية‎ 
للظواهر با مجان» والتي تعد. حاسمة ومفصليةء وذات قيمة حقيقية كنقاط بيانات للعلوم‎ 
الصحيحة. ويكون علماء ال مواطنة ذوي فائدة بشكل خاص من حيث الرصد لأنهم قد‎ 
عبر الزمن حيث من الصعب على‎ oS LI يكونون موزعين جغرافياً ومُدرجين ضمناً في‎ 
مستويي التنسيق والتكلفة استخدام مساعدي البحوث المهنيين لجمع القياسات الميدانية.‎ 
ومن الأمثلة على ذلك. قياسات هواة الرصد الجوي الناتجة من محطات الحدائق الخلفية‎ 
المواطنة‎ ele بدقة. وقد أصبح‎ ITA الفلك الذين را قوق‎ ele للأرصاد الجويةء وهواة‎ 
Suo التشاط‎ Jl: V لرواج العلم وتكميمك ولكق‎ loea alis (53 nl زام خلال ان‎ 
($3 ويعتمد على درجة معقولة من المهارات وا معارف وال معدات ال متخصصة مثل مرقاب‎ 

نوعية جيدةء وفوق ذلك قدر كبير من التحفيز والالتزام ا مستمرين. 

وقد صئف )2012 .(Bonney et al 2009; cited in Miller-Rushing et al.‏ أشكال 

dial! ole‏ في ثلاث فئات: 

٠‏ التساهمية :(Contributory)‏ وتصمم بشكل عام من قبل العلماء ولأجلها يسهم الأفراد 
عامة بالبيانات في المقام الأول. 

e‏ التعاونية :(Collaborative)‏ وتصمم بشكل عام من قبل العلماء ولأجلها يسهم الأفراد 
dale‏ بالبيانات» ولكن قد يساعدون أيضاً على تحسين تصميم ال مشروع., وتحليل «UI‏ 
ونشر النتائج. 

e‏ الإنشاء المشترك :((Co-created)‏ وتصمم من قبل العلماء وأعضاء من عامة الجمهور 
يعملون معا ولأجلها يتم إشراك بعض dale‏ المشاركين على الأقل في معظم أو جميع 
خطوات العملية العلمية؛ ويشمل ذلك أيضا البحوث التي وضع تصورها وتم تنفيذها 
من قبل علماء هواة (غير مهنيين) بشكل كامل. 
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العلماء فقط من ذوي ال مهارات الأكثر تقدما في مشاريع الإنشاء المشترك. ويمكن أن تتخذ 

المشاركة عددا من الأشكالء Le‏ في ذلك: 

٠‏ الحوسبة الموزعة: حيث يضيف أحد المشاركين قوة معالجة حاسوبية من أجهزة الحاسب 
الشخصية الخاصة به إلى المشروع مما يسمح بمعالجة البيانات باستخدام الموارد 
الحاسوبية منها (التساهمية). 

« النسخ / التحويل / الرقمنة: تحويل شكل من أشكال البيانات إلى آخرء على سبيل «JULI‏ 
تحويل وثائق مكتوبة بخط اليد إلى نص رقمي (التساهمية). 

٠‏ قياسات الرصد: ينتج العلماء البيانات» ولكن يستخدم علم المواطنة لإجراء القياسات 
باستخدام أدوات محددة يجري توريدها لهم (التساهمية). 

e‏ جمع البيانات: يجمع أفراد المواطنين البيانات ومن 63 يقومون بمشاركتها مع العلماء 
(التساهمية). 

o‏ تحليل الرصد: يقوم أفراد ا مواطنين بإجراء بعض التحليلء ما في ذلك توفير بعض التفسيرات 
ا قد تعنيه النتائج» بدلا من مجرد الاكتفاء بإنتاج أو قياس البيانات (التعاونية). 

3 754 تصميم البحث وتشغيله: يقوم أفراد المواطنين بدور نشط في تصميم وتشغيل‎ ٠ 
فضلا عن نشر النتائج والاستنتاجات (الإنشاء امشترك).‎ 


(Open Scientist 2013) 


الخلاصة: 

تطرّق هذا الفصل إلى العوامل المساعدة للبيانات الكبيرة ومصادرها. وتم بيان أن إنتاج 
البيانات الكبيرة قد تيسّر بفضل التقاء خمسة ابتكارات تقنية من بداية الألفية الجديدة 
فصاعداً وهي تنامي قوة المعالجة الحاسوبيةء وكثافة التشبيك الحاسوي, والحوسبة المنتشرة 
والحوسبة في كل مكان, والتعرّف وتحديد الهوية من خلال زيادة قابلية الفرز والقراءة Jf‏ 
وأخيراً التخزين الموزع الواسع النطاق. وقد أدّت هذه التطورات مجتمعة إلى مجموعة 
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متنوعة من النظم الاجتماعية التقنية التي تنتج البيانات الكبيرة. وقد قذم هذا الفصل 
مسار c3‏ أولي لهذه الأنظمة» حيث قسّمها إلى ثلاث فئات واسعة النقاط من أشكال إنتاج 
البيانات: daz Sl‏ والآلية. والتطوعية. وينبغي النظر إلى مثل هذا ال مسار باعتباره خطوة 
أولية في محاولة وضع خريطة لمشهد يتكشّف باستمرار. وما هو مطلوب حالياً يتمثل في 
مجموعة مفصّلة من الدراسات التجريبية التي تدرس بشكل أكثر عمقاً الطرق المختلفة التي 
يتم بها Ut‏ إنشاء ومعالجة واستغدام البيانات الكبيرة. كما تحتاج مثل هذه الدراسات 
إلى رسم أصول التقاء هذه التقنيات الممكنة وفك مجاميع البيانات التي تم م أنشاؤها وكيف 
تطبق bius‏ لإنتاج أشكال معينة من البيانات الكبيرة (انظر الفصلين 1 و11). وهذا يشمل 
تفكيك عناصر النظام المرتبط بها (انظر الفصل 7). axes‏ القيام بذلكء هكن الحصول على 
أفكار ورؤى أكثر عمقاً لكل نظام اجتماعي تقني ولمختلف العمليات والضوابط والسياسات 
المتصلة as‏ والعمل المتنوع الذي يقوم به في هذا العام. 

كما ينبغي لمجموعة مصاحبة من الدراسات أن تختبر ما قد يحدث عند ربط 
النظم الاجتماعية التقنية معاً لإنشاء أنظمة جديدة أكبر والتي من خلالها تنتج الآثار 
الهامة لتضخم البيانات. كما أن التقنيات التي تقوم عليها البيانات الكبيرةء والبيانات 
نفسها من خلال علائقيتهاء هي أنه جاهزة مثل هذه التوسعات. في الواقع» تكون 
مجاميع اجتماعية تقنية (Socio- Technical)‏ معقدة. مثل سلسلة متاجر التجزئة 
الكبيرة كووطارت (Walmart)‏ تقوم وعلى نحو متزايد. بربط العديد من الأنظمة 
J‏ إدارة سلسلة التوريد (Supply Chain Management)‏ تخطيط موارد 
امؤسسات (Enterprise Resource Planning)‏ إدارة علاقات العملاء Customer)‏ 
(Relationship Management‏ إدارة ا مخزون (Store Management)‏ وأنظمة 
Mosi do 0‏ والتي oS lea‏ من البيانات الموجهة, bid d‏ 


x‏ والموظفين وا لمستهلكين. وبالمثل, ET dale‏ السيطرة والتشغيل للمدن 
الذكية دمج أنواع مختلفة من البيانات التي تم جمعها من مصادر مختلفة في مركز 
واحد حيث يتم الجمع بينها وتحليلها بشكل آني أو لحظي (Real-Time)‏ مما يغيّر 
بشكل جذري الطريقة التي تدار وتحكم بها التجمعات المدنية (انظر الفصل السابع). 
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ممكنات البيانات الكبيرة ومصادرها 


وقد أثار مثل هذا التوسع وإعادة الضبط العديد من الأسئلة الاجتماعية والسياسية 
والأخلاقية والمعيارية المتعلقة بأنواع الأنظمة والأماكن التي نريد العيش داخلهاء وقد 
بدأنا بالكاد أن نسأل ونجيب عن هذه الأسئلة (انظر الفصل العاشر). 
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V۸ 


الفصل السادس 
آليات تحليل البيانات (Data Analytics)‏ 


ليست البيانات doo‏ ذاتها مفيدةء كما أنها ليست ذات فائدة إلا إذا أمكن استخلاص 
معنى وقيمة منها. وبعبارة أخرى, فإن ما هكن فعله حيال البيانات هو أمر أهم من مجرد 
عملية إنتاجها؛ إذ ترتكز جميع العلوم على تحقيق معنى وقيمة من البيانات. إن إيجاد 
واستشعار ا معنى من البيانات الصغيرة الموسعة والبيانات الكبيرة ينطوي على تحديات 
جديدة. ففي حالة البيانات الصغيرة ا موسعة» يكمن التحدي في ربط قواعد البيانات 
المتنوعة للحصول على رؤى جديدة: وانفتاح البيانات لتقبّل ا مناهج التحليلية الجديدة 
التي يجري استخدامها مع البيانات الكبيرة. أما بالنسبة للبيانات الكبيرة فيتمثل التحدي 
في التكيّف مع الوفرة والشمولية (متضمناً ذلك الكميات الكبيرة من البيانات ذات الفائدة 
والقيمة المنخفضة). والمناسبة الزمانية والديناميكية» والفوضى وعدم اليقين» والعلائقية 
العالية» والطبيعة شبه المنظمة وغير المنظمةء وحقيقة أن يتم إنتاج الكثير من البيانات 
الكبيرة دون أي سؤال sia‏ في العقل لتجيب عنه أو أنها في صحبة منتج هو نتيجة ثانوية 
لنشاط آخر. فالواقع» وحتى وقت قريبء تم تصميم تقنيات تحليل البيانات بشكل أساسي 
لاستخلاص رؤى من مجموعات بيانات شحيحة. dug‏ ونظيفة» وضعيفة العلائقية» وجرى 
جمعها بطرق علمية وملتزمة بافتراضات صارمة مثل الاستقلاليةء والثبات» والعياريةء كما 
جرى إنتاجها وتحليلها مع وضع سؤال محدد في الاعتبار )2010 H.J. Miller‏ 

حتى وقت قريب كان تطوير أدوات للربط بين مجموعات البيانات المختلفة وتحليل 
البيافات' الكبيرة lush‏ مسب التعقيه اللرشظ بتظوب cole odas‏ هن d]‏ 
الحاسوبية. وم يجر تحليل مجموعات البيانات الضخمة بشكل منتظم سوى في السنوات 
الأربعين الماضية أو نحو ذلك. وحتى ذلك الحين كانت هذه التحليلات قائمة على مبادرات 
خاصة قادرة على تحمّل الموارد اللازمة. وبدون طاقة حاسوبية عالية واسعة الانتشار 
ويمكن النفاذ إليهاء سيكون إيجاد واستشعار ا معنى من طوفان البيانات الهائل مكلقًا 
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للغاية أو صعب التطبيق ويستغرق وقنًا طويلا. وبالطبع» هناك نوج ما من الجدل الدائر 
في الواقع هنا؛ إذ دون الحوسبة الواسعة الانتشار في كل مكان م يكن إنتاج البيانات الكبيرة 
ليكون في المقام الأول. ومع EUS‏ كما ذكر Hastie et al. (2009: xi)‏ فإنه بالنظر إلى 
«ظهور الحواسيب pasg‏ ال معلومات, فقد تفاقمت المشاكل الإحصائية من حيث الحجم 
والتعقيد». 


وتمثل الحل لتحديات معالجة وتحليل البيانات الصغيرة eigh‏ والبيانات الكبيرة 
مجموعة جديدة من آليات إدارة المعلومات والتخزين (انظر الفصل الخامس) وتطوير 
أدوات تحليل البيانات الكبيرة. فمنذ بداية الحوسبة استمرت هذه الآليات والأدوات 
التحليلية الجديدة في التطور» وهي تقوم على اختبارات إحصائيةء ونماذج» وأساليب تمثيل 
صوري رصينة متبعة» كما أنها تعمل على إنشاء أساليب وطرق جديدة تضرب جذورها 
في البحوث المتعلقة بالذكاء الاصطناعي والأنظمة الخبيرة التي هدفت إلى إنتاج تعليم 
الآلة بحيث lice‏ حاسوبيًا وبصورة تلقائية التنقيب» والكشف عن DEYI‏ وبناء النماذج 
التنبئية. فمثل هذه الأدوات التحليلية أضحت ملائمة وبشكل مثالي في معالجة واستخلاص 
ا معلومات من مجموعات بيانات ضخمة ومتصلة ببعضهاء فقد أصبحت تشغل حيرا 
bus‏ من الاستثمار في البحوث من أجل توسيع وإنتاج طرق معالجة جديدة للبيانات 
والخوارزميات الإحصائية والنمذجة وتقنيات التمثيل الصورية (ال مؤسسة الوطنية للعلوم 
(National Science Foundation 2012‏ وتسعى هذه الأدوات التحليلية: كما هي 
مطبّقة في مجال الأعمال التجارية والعلوم: للإجابة عن ربع مجموعات أساسية من 
الأسئلة )2013 :(Minelli et al.‏ 


٠‏ الوصف :(Description)‏ ماذا ومتى حدث ذلك الشيء؟ وكم مرة يحدث؟ 
o‏ التفسير U :(Explanation)‏ حدث ذلك؟ وما هو تأثيره؟ 
٠‏ التنبؤ s (Prediction)‏ ماذا oS‏ أن يحدث بعد ذلك؟ وماذا لو فعلنا هذا أو ذاك؟ 


٠‏ العلاج (Prescription)‏ ما الحل أو النتيجة المُثلى؟ وكيف هكن تحقيق ذلك؟ 
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آليات تحليل البيانات 


وتستمد الإجابة عن هذه الأسئلة من أربع فئات رئيسة من آليات التحليل: التنقيب عن 
البيانات والتعرّف على الأأماطء التمثيل الصوري للبيانات وآليات التحليل do pal‏ التحليل 
الإحصائي» والتنبؤ والمحاكاة والتحسين. وسيتم مناقشة كل من هذه الفثات باختصار, ولكن 
ينبغي تقديم مرحلة ما قبل التحليل وتعلّم الآلة أولا لأنها مركزية لجميع الفئات الأربعة. 


ما يسبق التحليلات :(Pre-analytics)‏ 
تحتاج كل تحليلات البيانات إلى أن تكون البيانات المطلوب تحليلها معدّة سلفا للتحليل؛ بمعنى 

أنه قد جرى تجهيزها والتحقق منهاء وقد نين )2011( HJ. Miller (2010) and Han et al.‏ 

أربع عمليات فيما يتعلق بالبيانات d sl‏ والكبيرة والتي تطبّق عادة بالتسلسلء على الرغم من 

أنه لا يلزم تنفيذها بأي ترتيب معينء إضافة إلى إمكانية تكرار تنفيذها: 

o‏ اختيار البيانات :(Data selection)‏ تحديد مجموعة جزئية من المتغيرات الأكثر قيمة, 
وإطار العينة المحتمل oda)‏ المتغيرات. حيث لن تكون كل المتغيرات الناتجة ذات 
أهمية. ولا بالضرورة كل نقاط البيانات» فإدراج مثل هذه البيانات غير الضرورية في 
نماذج قد يولد التكرار وعدم الكفاءة. 

o‏ امعالجة اا للبيانات :(Data pre-processing)‏ تنظيف البيانات ا مختارة لإزالة 
الضوضاء أو الأخطاء أو التحيّزء أو التعامل مع الحقول ال مفقودة أو التناقضات وعدم 
السلامة. وهيكلة البيانات لإدخالها في عملية التحليل. 

٠‏ اختزال البيانات وإسقاطها :(Data reduction and projection)‏ التقليل من أبعاد 
البيانات من خلال التحويلات (على سبيل «JULI‏ التسوية والصقل (Smoothing)‏ 
وبناء السمات والخصائص, والتجميع» والتطبيع» والتسلسل الهرمي للمفهوم, والأساليب 
الإحصائية مثل تحليل مستوى الانحدار وتحليل المكونات الرئيسية) لمكافأة تمثيل 
البيانات ولكن بصورة أكثر كفاءة. 

Jio) دمج البيانات المختارة مع بيانات أخرى‎ «(Data enrichment) إثراء البيانات‎ ٠ 
بيانات التعداد السكاني وبيانات السوق) من أجل الوصول إلى رؤى يمكن الاستفادة منها‎ 
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الفصل السادس 


فمن جهة. صمّمت كل خطوة من هذه الخطوات من أجل زيادة نوعية البيانات 
المستخدمة في التحليل» ومن جهة «s‏ باستثناء إثراء البيانات» من أجل تقليل حجم 
البيانات التي على التحليل التعامل معها. فالأول تم تصميمه لتعزيز صحة وصلاحية 
الاستنتاجات المستخلصة بالنظر إلى الفوضى الكامنة وعدم اليقين في البيانات الكبيرة (انظر 
الفصل التاسع). في حين يهدف الثاني إلى زيادة الكفاءة التشغيلية مع الأخذ بعين الاعتبار 
أحجام البيانات وسرعاتها والأحمال الحاسوبية. ومن الممكن أن يكون من الصعب القيام 
بهذه ell‏ عند إجراء التحليلات بشكل آني أو لحظيء وخاصة فيما يتعلق بتنظيف البيانات. 
ونتيجة UI‏ وفيما عدا التمثيل الصوري للمؤشرات» لا يجري تحليل البيانات الكبيرة آنيا 
أو بشكل لحظيء ولكن يجري التحليل على سلاسل تمثل عينات كبيرة lie‏ لبيانات نظيفةء 
ومختزلة» ومخصّبة (ثرية) وخلال أزمان مختلفة. أما إذا كان المطلوب تحليلات بشكل آني 
أو لحظي» فتطبّق في العادة التحليلات المسبقة للبيانات s‏ على عينة من أجل تحديد 
طبيعة البيانات وكيفية التعامل معها للانتقاء والاختزال» والتنظيف على عجل. 


ويعد إثراء البيانات مهمة ذات قيمة عالية لأنها تنتج Crampton et al.) WEE GÍ‏ 
2012( كن من اكتساب رؤى لا هكن الحصول lade‏ من خلال قاعدة بيانات واحدة. 
وبحسب من تمت مناقشته في الفصل الثانيء فإن ام برر الرئيسي لإنشاء البنى التحتية 
للبيانات تمثل في إعادة استخدام البيانات. وإن التحدي يتمثل في إنشاء طرق لربط البيانات 
التي أنتجت لأغراض مختلفة بعضها ببعضء والتي قد تختلف أيضا في البيانات الوصفية 
ا مصاحبة لهاء ومعايير البيانات. ووحدات القياس» والإجراءات» والفئات» والنطاقء والتزامن» 
وتنسيقات ال «otl‏ أو إنشاء طرق للربط لتقليل حدوث المغالطات ال محتملة الناتجة عن 
الاستدلال (Creation of Potential Ecological Fallacies)‏ وهذه ليست مهمة يسيرة. 
ولكن تعمل الأساليب الحاسوبية على جعلها أسهل من خلال استخدام الخوارزميات التي 
يمكنها البحث, المطابقة, الدمج» إعادة الجمع من خلال أنواع مختلفة من التحولات» وإعادة 
تهيئة البيانات. وبالنتيجةء يمكن التنقيب والتحليل في مجموعة بيانات جديدة باستخدام 
الفئات الأربع الرئيسية للتحليلات التي سيجري نقاشها أدناه. 
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آليات تحليل البيانات 


ويمكن أن تكون أعمال التحليلات المسبقة مملة باستغراقها Ég‏ طويلاً للغايةء ولكنها 
مع ذلك مهمة جدًا ولا هكن تجاهلها. وبالنظر إلى الزيادة المنقطعة النظير في مختلف 
أنواع البنى التحتية الجديدة للبيانات والبيانات الكبيرة» فقد أصبحت منطقة ثرية للبحث 
حيث يسعى علماء البيانات إلى إيجاد طرق أكثر إنتاجية وكفاءة وفعالية لإتمام» وخصوصًا 
أتمتة. هذا العمل. 


تعليم الآلة أو التعلم الآلي :(Machine learning)‏ 

يمكن إجراء تحليل الأعداد الكبيرة Ie‏ من سجلات البيانات في إطار زمني مناسب عن 
طريق الخوارزميات الحاسوبية. وفي حين أن الكثير من عمليات تحليل البيانات الكبيرة 
يمكن إجراؤها بالطرق نفسه المتبعة في تحليل البيانات الصغيرة. حيث يتخذ ا محللون 
القرارات المتعلقة بالكيفية التي يتم فيها الاستكشاف من خلال هذه الخوارزميات» فإن 
الهدف من أغلب البحوث هو تطوير عمليات مؤتمتة ممكنها تقييم البيانات والتعلم منها منها 
ومن تحليلها. ويطلق على هذه العمليات المؤتمتة مصطلح تعلم الآلة أو التعلم JYI‏ 
وتشكل أحد فروع الذكاء الاصطناعي. ويهدف تعلم الآلة إلى التطوير المتكرر لفهم 
مجموعة البيانات؛ والتعلم التلقائي لإدراك أنماط معقدة slug‏ نماذج توضح وتتوقع مثل 
هذه الأنماط؛ وتحسين النتائج )2011 (Han et al.‏ 


ويتكوّن تعلم الآلة بشكل عام من نوعين رئيسيين: مُراقب (باستخدام مائات (casas‏ 
وغير مراقب (باستخدام التنظيم الذاتي). في التعلم المراقب» يتم تدريب نموذج لمطابقة 
اا ع esas n be‏ م ل مكن ف رمي E oed‏ ا 
البريدية المكتوبة بخط اليد مع مثيلاتها المطبوعة T‏ أو التنبؤ بنتائج معينةء فهي «مراقبة» 
بمعنى أن بيانات التدريب موجودة لتوجيه عملية التعلم )2009 etal.‏ 115816). في المقابلء 
تسعى نماذج التعلم غير الخاضعة للرقابة إلى تعليم نفسها على اكتشاف الأنماط وإيجاد هياكل 
البيانات دون استخدام بيانات التدريب. وبشكل el‏ يمكن تحقيق ذلك من خلال تحديد 
مجاميع وعلاقات بين البيانات التي لم يكن معروفا بينها مسبقًا خصائص للتشابه أو الارتباط. 
فعلى سبيل «JUL‏ يمكن أن يتعلم النموذج على كيفية تقسيم العملاء إلى مجموعات ذاتية 
متمائلة والتنبؤ بالمشتريات لتلك المجموعات )2011 (Han et al.‏ في كلتا الحالتينء يتم 
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إنشاء نموذج من خلال عملية التعلم التي شكلتها القواعد والأوزان التي توجه كيفية بناء 
نموذج فيما يتعلق بالبيانات (2009 .(Hastie et al.‏ وتبدأ عملية slo‏ نموذج من slo‏ بسيط 
ثم يتم التعديل مرارًا وتكرارًا على ذلك البناء باستخدام قواعد التعلم» Jib‏ كما يُطبق مع 
الطفراتٍ الجينيةء إلى أن يتطور البناء إلى £394 قوي )122 :2013 .(Siegel‏ وهناك شكلان 
للتعلم الراقب وغير المراقن وهما التعلم ية انراق الذي يشتمل على glas‏ گل فق 
التدريب والبيانات التي لا تحمل عناوين (وهي البيانات التي يمكن الحصول عليها بسهولة 
ولكنها غير مسماة كالصور والتسجيلات الصوتيةء والفيديوء المقالات الإخبارية. وغيرها من 
البيانات الخالية من أي ملصقات تتيح التعرف عليها بشكل (SÍ‏ والتعلم النشط الذي يتيح 
للمستخدمين القيام بدور نشط في توجيه نموذج التعلم )2011 (Han et al.‏ 

وقد جرى استخدام التعلم I‏ في جميع عمليات تحليلات البيانات الكبيرة quio‏ 
على الرغم من أن هذه التحليلات ليست مقتصرة في عملها على هذه الطريقة. ويتم 
إجراؤهاء في كثير من الحالات» من قبل الباحث بشكل مباشرء وحتى ضمن التعلم الآلي» 
يبقى المحلل ودوره مهما في الحكم على العملية وتوجيهها وتقييم النتائج الوسيطة. وكما 
لاحظ )2010( H.J. Miller‏ فإن التعلم الآلي ليس مجرد علم تلقائي وسهل «JULI‏ بل 
ينالب خيرة اال diae Drs‏ وهي المهارات التي لا يزال العقل البشري أفضل بها من 
أجهزة الحاستب be] e tes «dI‏ شام كب ق تطوير همات elsi‏ الى 4 V‏ 
Ul;‏ من العلوم الناشئة التي مازالت بحاجة إلى الكثير من البحث لتحسين فعالية ومتانة 
النماذج المنتجة. 

وفيما يلي» ez. o‏ مناقشة كل فئة من فئات التحليلات الرئيسية على حدةء على الرغم 
من أنه تجدر الإشارة إلى أنها Gle‏ ما تستخدم Ue‏ إلى جنب. على سبيل المثال» ينبغي أن 
يوفر التنقيب عن البيانات والتعرف على الأنماط أسس التنبؤ/التوقع أو التحسينء ويمكن 
استخدام الإحصاءات في التنقيب عن البيانات للكشف عن الأنماط أو في حساب التوقع/ 
التنبقؤ وقد يستخدم التمثيل الصوري في التنقيب عن البيانات» أو لتحصيل المخرجات من 
أنظمة المحاكاة... إلخ. 
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آليات تحليل البيانات 


التنقيب عن البيانات والتعرّف على الأنماط :(Data Mining and Pattern Recognition)‏ 

التنقيب عن البيانات هي عملية استخلاص البيانات bliis‏ من مجموعات البيانات 
الكبيرة )2011 .(Manyika etal.‏ ويقوم التنقيب عن البيانات على مفهوم امتلاك كل 
مجموعات البيانات الضخمة معلومات مفيدة ذات معنى على صورة غير عشوائيةء وذات 
صلاحية سارية المفعولء وقابلة للرواية» ومفيدةء ومفهومة في نهاية المطاف Han et)‏ 
(al. 2011‏ وبالمثلء يستخدم التعلّم USE‏ المراقب وغير المراقب للكشف والتصنيف 
والتقسيم عن العلاقات والارتباطات والاتجاهات ذات ال مغزى بين المتغيرات. وهي تقوم 
بذلك باستخدام سلسلة من التقنيات ما في ذلك معالجة اللغات الطبيعيةء والشبكات 
العصبية» وأشجار اتخاذ القرارء والأساليب الإحصائية (دون معاملات وذات المعاملات). 
وتختلف طريقة الاختيار بين نوع البيانات (المنظمة» وغير المنظمةء وشبه المنظمة) والهدف 
من هذا التحليل (انظر الجدول ١‏ -1)). 

الجدول رقم )١ - V)‏ 
مهام وأساليب التنقيب عن البيانات 
مهمة التنقيب عن البيانات 


التجزئة أو التجميع تحديد قائمة من المجموعات التحليل العنقودي (Cluster Analysis)‏ 
Segmentation or)‏ الضمنية التى تصف البيانات 
(Clustring‏ 


التصنيف (Classification)‏ التنبؤ باسم الفئة التي تنتمي تصنيف النظرية الافتراضية 
إليها مجموعة من البيانات 
استنادا إلى بعض مجموعات 


(Bayesian Classification) 
بيانات التدريب. استقراء شجرة القرارات‎ 
(Decision Tree Induction) 
الشبكات العصبية الذكية‎ 
(Artificial Neural Networks) 
آلة دعم التمييز‎ 


(Support Vector Machine) 
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قوانين الارتباط 


(Association Rules) 


تصنيف النظرية الافتراضية 
(Bayesian Classification)‏ 
التحليل العنقودي 
(Cluster Analysis)‏ 
كشف الانحراف 
(Outlier Detection)‏ 
تحليل التطور 
(Evolution Analysis)‏ 
الانحدار (Regression)‏ 
استخلاص تسلسل النمط 
(Sequence Pattern Extraction)‏ 
القواعد والقوانين الموجزة 
(Summary Rules)‏ 


الاستقراء اموجه بالسمات 
(Attribute-Oriented Induction)‏ 


الفصل السادس 


إيجاد روابط بين كائنات 
البيانات؛ التنبؤ بقيمة بعض 
الحقول بالاعتماد على قيمة 
حقول أخرى 


(Association) Ja; JI 


إيجاد عناصر البيانات 
ا معرضة للانحراف عن 
T‏ 


(Deviation) الانحراف‎ 


الاتجاهات والمنحنيات التي 
تلخص قواعد البيانات» عادة 
عبر الزمن 


(Trends) الاتجاهات‎ 


التعميم (Generalization)‏ | دمج مواصفات البيانات 





(Miller and Han (2009: 7 المصدر:‎ 


إن معظم الآليات المدرجة في الجدول )6-1( تتصل بالبيانات المنظمة كتلك الموجودة في 
قواعد البيانات العلائقية. على سبيل JELI‏ من الممكن تطبيق نماذج التجزئة على قواعد بيانات 
عملاء التجزئة ومشترياتهم لتقسيمهم بحسب معرّفات مختلفة بالاعتماد على خصائصهم 
وأنماط سلوكهم من أجل تقديم عروض/ خدمات مختلفة لكل مجموعة مختلفة. وفي تحليل 
الشبكات الاجتماعية. GSE‏ تحليل الروابط بين الأفراد لفهم المتغيرات الاجتماعية وكيفية تدفق 
المعلومات فيما بينهم. وفي كشف الارتباطات» Se‏ استخدام مجموعة متنوعة من TL‏ 
الانحدار في الكشف عن الروابط لحساب الاقترانات بين المتغيرات» ومن ثم الكشف عن الأماط 
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آليات تحليل البيانات 


الخفية التي يمكن الاستفادة منها لتحقيق مكاسب تجارية ule)‏ سبيل JULI‏ تحديد ما يتم 
شراؤه كوحدة من البضائع وإعادة تنظيم ا مخزون لتعزيز الشرائية) (انظر الفصل السابع). 

وتثير البيانات غير المنظمة» والتي تكون على شكل نصوص أو صور أو أصوات» تحديات 
خاصة فيما يتعلق بالتنقيب عن البيانات. فآليات معالجة اللغات الطبيعية تهدف إلى 
تحليل اللغة الإنسانية التي يجرى التعبير عنها من خلال الكلمة المكتوبة والمنطوقة. وهي 
تستخدم دلالات وتصنيفات من أجل التعرّف على الأنماط واستخراج المعلومات من الوثائق. 
وتشتمل الأمثلة على استخراج العنصر الذي يستخرج البيانات الوصفية من النص بصورة 
تلقائية من خلال البحث عن أنواع معينة من النصوص والتعابيرء مثل أسماء الأشخاص 
وا مواقع والتواريخ وا مصطلحات التخصصية والتراكيب المنطقية؛ واستخراج العلاقات التي 
Ses‏ تلقاتيًا العلاقات بين العناصر الدلالية» وربطها معا (على سبيل JULI‏ اسم الشخص 
وتاريخ ميلاده أو مكانه» أو رأيه ببند (McCreary 2009) (L‏ ومن التطبيقات النموذجية 
مثل هذه الآليات التحليل الوجداني الذي يسعى إلى تحديد الطبيعة العامة للآراء وقوتها 
حول قضية cdo‏ على سبيل JEL‏ ما يقوله الناس عن انتج على وسائل التواصل الاجتماعي. 
كما هكن تعقب أماكن نشوء هذه الآراء باستخدام البيانات الوصفية الموضعية Graham)‏ 
(etal. 3‏ والتنقيب عن نشر المعلومات داخل وسائل التواصل الاجتماعيء على سبيل 
المثال» تبادل عناوين المواقع الإلكترونية الأكثر تفضيلاً ومشاركتها بين مختلف المستخدمين 
.(Ohlhorst 2013)‏ فهذه المعلومات مفيدة للشركات» مثل الوكالات الإعلانيةء والمسوقين, 
والخدمات المالية» والتي تسعى إلى الاستفادة من الاتجاهات الناشئة والوصول المنظم في 
الوقت المناسب (على سبيل «JULI‏ لوضع إعلانات تتناسب مع الأحداث الجارية؛ لبيع وشراء 
الأمهم قبل ردة الفعل العنيفة للسوق). 

أما الصور فيتم إنشاؤها للتخزين والعرضء وليس للمحتوى والبحث )2013 (Ohlhorst‏ 
فكشف وتصنيف واستخراج أنماط داخلهاء مثل التعرف على الوجه أو مكانء ليس بالأمر 
السهلء ولكن يتم التعامل مع ذلك من خلال تقنيات اللمسح التصويريء والاستشعار عن 
بعد» ومعالجة الصور وتقنيات الاستبصار الآلية» متضمنا ذلك التعرف على الأشياء ومطابقة 
القالب باستخدام مجموعات التدريبء وطرق التجميع» والشبكات العصبية. وتتفاقم 
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الفصل السادس 


مشكلة التنقيب في الصور عند محاولة استخراجء ومقارنةء وفهرسة الأنماط لعدد هائل من 
الصور )2001 (Zhang et al.‏ وبرغم أن التنقيب في الصور لا يزال من المواضيع الناشئة, 
إلا أنه أصبح أكثر تقدمًا في السنوات الأخيرة. فعلى سبيل «JULI‏ فإن الموقع الإلكتروني 
على شبكة الإنترنت: (http://imagevision.com)‏ يدعي بأنه سيكون قادراً على تصنيف 
0 دقيقة من الفيديو في الساعة الواحدةء لكل خادم» وذلك باستخدام خوارزميات 
التعلم NI‏ للكشف عن بعض الخصائص مثل العري وشعارات الشركات. 

التمثيل الصوري للبيانات وآليات التحليل الصورية Data Visualisation and)‏ 
:(Visual Analytics‏ 


شاعت مقولة تنص على أن صورة واحدة تغني عن ألف كلمة. وبالمثل» جرى استخدام 
السجلات البصرية لاختزال ووصف مجموعات البيانات من خلال ال مخططات والرسومات 
الإحصائية, والرسوم البيانية» والخرائط» والرسوم المتحركة. وتكشف هذه الأساليب البصرية 
وتوصل على نحو فعال هيكل المتغيرات» وأنماطهاء واتجاهاتهاء والروابط بينها. وبالنظر إلى 
الحجم الهائل للبيانات الكبيرة وسرعتهاء فليس من المستغرب إذا أن التمثيل الصوري قد 
صار وسيلة شعبية لاستشعار البيانات وإيصال هذا الشعور. 

ويمكن استخدام التماثيل الصورية الناشئة ضمن عام التقنية الرقمية للتنقل والاستعلام 
عن البيانات» مما يتيح للمستخدمين الحصول على ملحة dale‏ عن كامل مجموعة البيانات» 
بالتركيز على البنود المهمةء واستبعاد البيانات غير aal‏ واختيار عنصر بياني أو مجموعة 
من البيانات والحصول على مزيد من التفاصيلء وعرض العلاقات بين pola‏ واستخراج 
مجموعات فرعية من التفاصيل عند الحاجة )1996 .(Shneiderman‏ وعند عمل «A5‏ مكن 
الكشف عن خصائص وبنية مجموعات البيانات» وأكثر من ذلك يمكن استخدامها لتوضيح 
وفهم النماذج ومجموعات البيانات المعقدة التي يتعذر تمثيلها بطريقة مجردة وواضحة 
ومفهومة (مثل الظواهر cb JI‏ والظواهر الفلكية الثلاثية الأبعاد)» ورسم عشرات الآلاف 
من نقاط البيانات للكشف عن dadl‏ والتجميعات, والثغرات» والقيم الشاذة التي قد تظل 
بدلاً من ذلك مجهولة في الخفاء )1996 (Shneiderman‏ على سبيل «JE‏ استيعاب وفهم 
ملايين التغريدات على شبكة التواصل الاجتماعي تويتر ليست dagg‏ سهلة. فيمكن للمرء 
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آليات تحليل البيانات 


الحصول على فكرة تقريبية عن القصص أو المواضيع التي تبدو واعدةء ولكن الحصول على 
نظرة عامة وشاملة هي مهمة غاية في الصعوبة» وكيفية تغير التوجه على مستوى الجماهير 
والأماكن. فأحد الحلول يتمثل في رسم خريطة تغريدات موزعة جغرافيًا ومصنفة بحسب 
اميول والأهواء وهو نهج جرى الأخذ به من خلال فريق عمل الموقع الإلكتروني http://)‏ 
.(floatingsheep.org‏ لقد أنشؤوا عشرات الخرائط حول توجهات ال مواضيع «lao xls‏ 
واشتمل ذلك على الشكل )3 - (V‏ والذي يعرض التوزيع الجغرافي لتغريدات التخوف من 
المثليين في الولايات المتحدة من يونيو ۲۰۱۲ م وحتى إبريل ۲١٠۳‏ م. كما أنهم عرضوا 
محتوى موسوعة الويكيبيديا وجوجل بالنسبة لمواضع التوزيع الجغرافي حول العام. 


ويشيع استخدام التمثيل الصوري أيضا ليكون وسيلة للمراقبة الآنية المستمرة لظاهرة 
ما بشكل آني أو لحظيء مما يتيح تعقب ورصد العديد من المتغيرات عبر الزمان Oly‏ 
والمقارنة بينهاء وتحديد التغيير الحاصل. فلوحات التحكم والعرض (Dashboards)‏ 
للبيانات المتغيرة تكون غالبا معروضة على شاشات الحاسب الآلي في غرف التحكم الحديثة, 
وهي تلخص على نحو صوري الأنظمة المتغيرة باستمرار للمشغلين الآدميينء مع سلاسل 
زمنية ورسوم بيانية وخرائط للكشف عن الأحداث (انظر ليك 2013 Lake‏ للمقارنة بين 
٤‏ لوحة عرض). وعلى «JULI Jaco‏ هكن أن توفر البيانات من مختلف أنحاء نظام النقل 
خريطة لتدفق حركة المرور وتقارير الحوادث بشكل T‏ أو لحظي؛ أو مواقع الطائرات 
غلل رو ركا غير منطقة ما Eo)‏ الشكل Y‏ - و كنا قد توف اقات رادار االظقس ج دة 
لهطول الأمطار بشكل آني أو لحظي ومحاكاة للساعات القليلة الماضية. فمثل هذه البيانات 
الصورية لا تساعد ضباط إدارة حركة المرور والراصدين الجويين فقطء ولكن أيضًا المواطنين 
الذين يمكنهم الوصول إليها ومتابعة الأوضاع الجارية باستخدام الحاسب الآلي أو الهواتف 
الذكية وتبديل سلوكهم لتجنب طرق معينة أو التعامل بشكل مناسب مع المستجدات. 
ومثال على نموذج أولي للوحة تحكم خاصة ممدينة dale‏ تضم مجموعة من البيانات الآنية 
أو اللحظية عن الطقس., cols‏ الهواء. ومعوّقات حركة مرور النقل «ell‏ وتوافر الدراجات 
العامة ومستوى ارتفاع ا منسوب UI‏ النهريء وارتفاع الطلب على الطاقة الكهربائية 
وسوق الأوراق AIUI‏ واتجاهات التغريدات على شبكة التواصل الاجتماعي تويترء وتغذية 
كاميرات مراقبة حركة ا مرور تلك ال معروضة في الشكل CY)‏ 
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الفصل السادس 


الشكل رقم ١(‏ - ( 
التوزيع الجغرافي لتغريدات التخوّف من المثليّة في الولايات المتحدة الأمريكية 





http://users.humboldt.edu/mstephens/hate/hate map.html£ امصدر:‎ 
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الشكل رقم (Y - Y)‏ 
المواقع اللحظية مسار الرحلات الجوية 





http://www.flightradar24.com/ امصدر:‎ 
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الفصل السادس 


الشكل رقم )* - ( 
لوحة معلومات مدينة لندن الخاصة بالمركز البريطاني للتحليل العمراني المتقدم 
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التحتية للبيانات 


« والنتائج المترتبة عنها 


آليات تحليل البيانات 


ومن الممكن أيضا استخدام التمثيل الصوري كشكل من أشكال الاستنتاج التحليلي. 
وهناء لا يصف أو يعرض التمثيل الصوري مجرد البيانات فقطء ولكن يجري استخدامها 
أداة تحليلية. ويتم توجيه هذه الطريقة» والتي يطلق عليها مصطلح التحليلات الصورية 
في الغالب بواسطة مجموعة من الأشخاص والخوارزميات التي تعمل باتساق لاستخراج 
البيانات» وبناء النماذج البصرية وتفسيرهاء والمضي LASS‏ في المزيد من التحليل الإحصائي 
(Keim et al. 2010)‏ لقد أصبحت آليات التحليل البصرية NY Sion‏ وجديدًا من 
مجالات البحث» وهو الأمر الذي أسهم في تطوير حقل التمثيل الصوري للمعلومات من 
خلال دمج pole‏ التنقيب عن البياناتء وعلوم الإحصاء والإدراك Thomas and Cook)‏ 
6. فالعديد من أنواع الرسومات البصرية المختلفة شائع الاستخدام» وهي في العموم 
تفاعلية وتتيح للمستخدم التعامل معها والتلاعب في الصور من أجل البحث والكشف 
عن Je LLEVE‏ والروابط. وبالإضافة إلى ذلك فإن الشاشات ال معروضة للمستخدم متصلة 
ببعضها في الغالب بحيث إن التفاعل مع إحداها ينعكس على الأخريات» مما QS‏ من 
تفخص جوانب من البيانات من أكثر من منظور واحد في ذات الوقت. فعلى سبيل «JULI‏ 
يعرض الشكل )€-( أنواع آليات التحليل الصورية المتاحة ضمن أدوات آليات التحليل 
الصورية (GAV)‏ ا موضوعة من قبل المركز الوطني للتحليلات الجغرافية الصورية في 
جامعة ينكوبينج (Linkóping University)‏ في السويد. بالإضافة إلى توفيرها مجموعة 
سق الأدوات scd tai‏ أذوات االحموفة من تخل الاقات واس js ssl‏ 
تعاوني» وبناء التطبيقات والتداخل مع تطبيقات الخرائط كخرائط جوجلء وبناء وتبادل 
القصص السردية. وينشئ الأقير تعدا aod‏ وات ما مكن الزملاء وغيرهم من 
تبادل تفسيرات حسية متعلقة بالتمثيل الصوري (انظر الشكل 0 - .)١‏ 


التحليل ١‏ لإحصائي :(Statistical analysis)‏ 
هناك تاريخ طويل من الأساليب الإحصائية التي يجري تطبيقها على البيانات الكمية في 
محاولة لفهمها. فالإحصاء الوصفي Lai‏ خصائص وتوزيع نقاط البيانات ومستوياتها من 
الخطأ وعدم اليقين. ويشتمل الإحصاء الوصفي على تحليل السلاسل الزمنية التي تنص على 
كيفية تغيّر البيانات بمرور الزمن» ونظرية الرسم البياني التي تدرس بشكل رياضي تنظيم 


ثورة البيانات البيانات الكبيرة» والبيانات المفتوحةء والبنى التحتية للبيانات» والنتائج المترتبة عنها 110 


الفصل السادس 


هياكل الشبكة. والإحصاء المكاني الذي يصف هندسة وأنماط التجميع: والتشتت. والانتشار 
في حين يسعى الإحصاء الاستدلالي إلى شرح» وليس مجرد وصف» الأنماط والعلاقات التي 
قد توجد داخل مجموعة البيانات» واختبار قوة وأهمية الارتباطات بين المتغيرات. كما 
يشمل الإحصاء البارامتري (المعلمي) الذي يجري استخدامه لتقييم الفرضيات باستخدام 
بيانات الفاصل الزمني وبيانات مستوى النسبة» مثل الارتباط والانحدار؛ والإحصاءات غير 
المعلمية المستخدمة لاختبار الفرضيات باستخدام بيانات ال مستوى الاسمية أو الترتيبية؛ 
والإحصاءات الاحتمالية التي تحدّد احتمال حدوث حالة de‏ مثل تحليل النظرية الافتراضية 
(Bayesian)‏ ويجري تطبيق تقنيات الإحصاء الوصفي والاستدلالي التي تستخدم تقليديًا 
في تحليل البيانات الصغيرة في البيانات الكبيرة أيضاء وكما جرى نقاشها في الفصل التاسع 
فإن هذا ليس سهلاً على الدوام لأن الكثير من هذه التقنيات جرى وضعها لرسم رؤى من 
البيانات الشحيحة وليست الممتوافرة بشكل فائض. ومع EUS‏ توفر هذه التقنيات وسائل 
للاستفادة من كميات البيانات الهائلة» كما يضمن حجم البيانات الهائل إمكانية تجزئتها إلى 
مجموعات بطرق عديدة دون أن تصبح صغيرة جدًا مما لا Sue‏ معه حساب الاختلافات 
بين مجموعتي الضبط وامعالجة بصورة DIS‏ معنى. وتستخدم الإحصاءات بشكل روتيني 
في المساعدة على التنقيب عن البيانات والتنبؤ بها وتحسينها (انظر الجدول .)١ - ١‏ 


التوقع والمحاكاة والتحسين (Prediction, Simulationand Optimisation)‏ : 
هناك طريقة أساسية في الحصول على القيمة من البيانات وهي استخدامها لمحاولة 

معرفة أو توقع ما سيحدث في JB‏ ظروف مختلفة. على سبيل JELI‏ قد ترغب شركة ما في 
توقع ردود أفعال العملاء تجاه منتج معين أو حملة ماء أو قد تحتاج الحكومة المحلية إلى 
محاولة التنبؤ بكيفية عمل البنى التحتية للنقل إذا جرى إغلاق عنصر مهم ذو حساسية» أو 
قد يسعى العلماء إلى التنبؤ موعد احتمال حدوث انهيار أرضي وتحت أية ظروف. إن مثل 
هذه المعلومات مفيدة جدا للمنظمات من حيث تمكينها من التخطيط لحالات الطوارئ 
ا مختلفة: وللشركات من حيث إنتاج Sl‏ لزيادة نمو الأرباح (انظر الفصل السابع). وفي 
جميع الحالات» تبنى النماذج باستخدام المعرفة القائمة سلفا عن كيفية عمل eal‏ والتي 
تعالج البيانات لتقدير النتائج المحتملة في ظل سيناريوهات مختلفة. وكما في التنقيب عن 
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البيانات» هناك العديد من الطرق المختلفة التي يمكن استخدامها لإنتاج النماذج التنبئية. 
ولكل منها نقاط قوتها وضعفهاء وهي تنتج تنبؤات La Jl‏ أو jS]‏ دقة بالاعتماد على 
نوع المشكلة والبيانات )2010 (Seni and Elder‏ ومع ذلك من الصعب الحكم NR‏ 
على أن أي نوع من النماذج» وإصداراته ال مختلفة. سيعمل بشكل أفضل على sÍ‏ مجموعة 
بيانات معطاة. وقد تمثل الحل لهذه المسألة في استخدام نهج مركب يستفيد من الكمية 
الهائلة من الطاقة الحاسوبية المتاحة للمحللين الآن )2013 (Siegel‏ فعوضًا عن اختيار 
نهج واحد وبناء عدد قليل من النماذج. فالنهج المركب يبني نماذج متعددة باستخدام 
مجموعة متنوعة من التقنيات للتنبؤ بالظاهرة نفسها. وبعد «US‏ بدلا من تحديد النتائج 
(التقديرات) من النموذج الأفضل «lol‏ يجري العمل على الجمع بين التقديرات من جميع 
النماذج لإنتاج إجابة واحدة شاملة. ويؤدي تجميع النتائج إلى نتائج أكثر قوة كما تعض 
العملية نقاط الضعف في كل نموذج. على سبيل JULI‏ قد يبني نهجا مركبا لتوقع سلوك 
العملاء سلسلة من نماذج الانحدارء والشبكات العصبية» والجار الأقرب» وشجرة القرارات. 
فكل نموذج قد يكون أفضل من غيره في التنبؤ بأنواع معينة من المستهلكين: ولكن يمكن 
تقليل الفروقات من خلال الجمع بين مخرجات النموذج» مما يزيد التنبؤ قوة Franks)‏ 
Siegel 2013‏ ;2012(. فباستخدام طريقة تضم العديد من النماذج ا منسجمة oue‏ تطبيق 
المئات من الخوارزميات المختلفة على مجموعة بيانات» ومن ثم ضمان إنتاج أفضل نموذج 

فا محاكاة هي عبارة عن نماذج تسعى إلى نمذجة العمليات والأنظمة في العام الحقيقي. 
والهدف من ذلك هو تحديد كيفية عمل نظام ما وكيفية سلوكه وفقا لسيناريوهات مختلفة, 
وتقييم أدائها إحصائيًا بهدف تحسين كفاءتها وفعاليتها )2003 (Robinson‏ ومن الأمثلة 
الشعبية لعبة الحاسب الآلي سيم سيتي (SimCity)‏ التي تحاي كيف هكن لمدينة أن تنمو 
وتتطور في ظل ظروف يختارها اللاعبونء قائمة على أساس النموذج الكامن وراء العمليات 
ا مدنية ال معروفة. وبالمثلء تستند توقعات الطقس على محاكاة LASI‏ تطور الطقس بالنظر 
إلى الظروف السائدة والمعرفة العلمية. وهناك العديد من الأنواع المختلفة لنماذج المحاكاة, 
والتي استفاد كثير منها من التعلم الآلي من أجل تحسين عمل النموذج بشكل تلقائي 
والتعامل مع الخصائص الناشئة مثل الأحداث غير المتوقعة. إن نموذج سيم سيتي هو 


ثورة البيانات البيانات الكبيرة» والبيانات المفتوحةء والبنى التحتية للبيانات» والنتائج المترتبة عنها 1۹۷ 


الفصل السادس 


نموذج قائم على التوكيل )2007 (Agent-based) (Batty‏ ويتكون هذا النموذج من بيئة 
تمكن من تعيين خصائص معينة للميزات الفردية فيها مثل المباني والطرق. ويتم تعيين 
خصائص هذه البيئة بواسطة وكلاءء وعند تشغيل النموذج» يسعى الوكلاء إلى حل مهمة ماء 
والتفاعل مع البيئة وغيرهم من الوكلاء الآخرين بالاعتماد على خصائصهم المسندة إليهم. 
وبا محصّلة: عند قيام الوكلاء مهامهم» يقومون بتغيير البيئة. وهي في هذه الحالة امدينة 
التي يسكنونهاء وإنتاج نظام معقد ومتغير. ومن ثم OB‏ النظام يعمل من أسفل إلى أعلىء 
مع أنماط مكانية وزمانية تتغيّر من تفاعلات الوكلاء الفردية مع البيئة. وتستخدم مثل هذه 
النماذج لمحاكاة القضايا المدنية خارج الألعاب لنمذجة استخدام الأراضي وتخطيط النقل 
ووضع خطط الطوارئ للكوارث )2007 (Batty‏ 


ويهتم التحسين بتحديد الإجراء الأمثل لتحسين الأداء (عادة من خلال خفض التكلفة 
أو زيادة العائد أو المخرجات). ويمكن حساب التحسين باستخدام وتقييم نماذج التنبؤ 
والمحاكاةء أو تطويرها من خلال أنواع أخرى من الخوارزميات أو الاختبار الإحصائي. فعلى 
سبيل المثاله تستخدم الخوارزميات الجينية. وهو نوع معين من التعلم «ISI‏ الأفكار 
المنتقاة من الطبيعة. مثل الوراثة. والطفرات» والاختيار والتهجينء لوضع وتطوير حلول 
ممكنة لمشكلة ما )1996 (Mitchell‏ كما يسعى ele‏ الشبكات العصبية» وهو نهج آخر 
مستوحى بيولوجياء لمحاكاة كيفية عمل الدماغ البشريء باستخدام polis‏ المعالجة العالية 
الترابط لحساب وتقييم وحل مشكلة ما )2000 .(Picton‏ كما يمكن استخدام اختبار coll‏ 
(A/B Testing)‏ بشكل دوري لتقييم وتطويع نظام cdo‏ من خلال مقارنة مجموعة ضوابط 
مع مجموعات اختبار مختلفة من أجل تحديد العلاجات (على سبيل «JULI‏ النصوص» 
والتصاميم» والصورء والألوان المستخدمة على موقع إلكتروني على الإنترنت) لتحسين هدف 
معين (Ae)‏ سبيل (JULI‏ معدلات التبرع). 


الخلاصة: 
كان الهدف من هذا الفصل تقديم dale dob‏ عن مجموعة من الآليات الناشئة وتحليلات 


البيانات التي يتم استخدامها لمعالجة وتحليل وتطبيق البيانات الصغيرة الموسّعة والبيانات 
الكبيرة. لقد تم نبذ مثل هذه الأساليب لعدد من السنوات» ولكنها أصبحت أكثر Dial‏ 


۸ ثورة البيانات البيانات الكبيرة» والبيانات المفتوحة» والبنى التحتية للبيانات» والنتائج المترتبة عنها 


آليات تحليل البيانات 


ويمكن الوصول إليها مع تطورها ونضجهاء وتوفر ا معالجة الحاسوبية المطلوبة لتصبح متاحة 
على نطاق أوسع. ومع ذلك» يطرح حجم وسرعة البيانات الكبيرة تحديات جدية OUS‏ 
التحليل وما قبلها بسبب عدم تصميم العديد من هذه الآليات التقليدية والخوارزميات 
لتتناسب مع المليارات من الملاحظات» أو لتتعامل مع مجموعات بيانات سريعة التغير 
.(Batty et al. 2012)‏ ومن ثم فمن الواضح أن هناك حاجة إلى مزيد من البحوث 
لتكييف. وصقل وتوسيع الآليات الحالية وابتكار أساليب جديدة يمكن لها إضفاء معنى من 
البيانات الكبيرة والبنى التحتية للبيانات واستخلاص القيمة منها. وعلاوة على US‏ أضحت 
الأجيال الجديدة والقديمة من العلماء ومحللي الأعمال. على حد سواء بحاجة إلى التعرف 
على مصادر البيانات الجديدة وخصائصهاء وأن تتعلم مجموعة جديدة من امهارات إذا 
كانت تريد أن تكون قادرة على الدراسة والاستفادة من رؤى وأفكار طوفان البيانات القائم» 
متضمنا ذلك معالجة البيانات المنظمة والبينات غير المنظمة» والترميز الأساسيء والتنقيب في 
البيانات» والتمثيل الصوريء والنمذجة. والمحاكاة (انظر الفصل التاسع). 

إن هذه التحديات لا تقوم على مجرد أسس تقنية أو موارد بشرية. فإن آليات التحليل 
تعد انعكاسًا لطريقة معينة في الرؤية والاستشعار للعام المحيط؛ فهي مظهر من مظاهر 
المعرفة الخاصة. وكما نوقش في الفصل الثامنء تثير البيانات الصغيرة الموسعة والبيانات 
الكبيرة وآليات التحليل ال مرتبطة بها تساؤلات جوهرية بشأن تنظيم وممارسات العلوم 
(Floridi 2012)‏ مع العديد من المقترحات التي توحي بالدخول في نموذج علمي جديد. 
ونتيجة U‏ لا يتطلب التصدي لطوفان البيانات مجرد فكر جديد حول طرق التحليلء 
ولكن تفكيراً متأنيًا فيما يتعلق بفلسفة العلوم )2012 (Leonelli‏ ويستدعي جزء كبير من 
هذه المهمة التفكير النقدي في التأطير الواسع للتحليلات وآليات الطرق والمناهج المحددة, 
والتفكير في كيفية إنتاج آليات التحليل الجديدة أنواعًا معينة من المعارف والرؤى للعالم 
المحيط بناء ومن ثم العمل على معرفة عمل هذه المعارف الجديدة في العام متضمنا 
ذلك نمذجة كل الأشياء التي تشير إليها )2013 ‘Beer and Burrows 2013; Ruppert‏ 
انظر الفصل الحادي عشر). وبعبارة أخرى. هنالك حاجة ملحة وبصورة عاجلة للبحوث 
الفنية والفلسفية فيما يتعلق بآليات التحليل الناشئة من أجل استشعار البيانات الموسّعة 
والبيانات الكبيرة. 
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المبررات الحكومية والتجارية للبيانات الكبيرة 


(The Governmental and Business Rationale for Big Data) 


لم تتكشف ثورة البيانات دون فكر وبطريقة مجهولة, فكما هو حال الثورات 552« 
جرى الدفع بها بسبب مجموعة قوية من الحجج. والتمهيد لها من قبل مجموعة من 
ا متحمسين المؤمنين بفوائد الطرق الجديدة للمعرفة والتعامل في هذا العام وتحالف 
أصحاب المصالح الخاصة الذين يجنون الأرباح من ظهورها. وفي حين أن الحجج التي 
استغدمت يكن أن 0335 مسوعة Los o les due‏ عن وجهات eaaa js‏ إلا (asl‏ 
تشكل في مجموعها ما أطلق عليه )1977( Foucault‏ مصطلح نظام الخطابة والمجادلة. 
أي مجموعة من النقاشات المتداخلة التي 53) وتغذي التطورات الجديدة وتعمل على 
تطبيعها واستنساخها وإعادة استخدامها. فهذا النظام الخطابي يقدّم الأساس المنطقي 
لتبني الأفكار والتقنيات الجديدة» وإضفاء الشرعية على مساعي تطويرها وسبل تنفيذها. 
وتدعو النقاشات المستخدمة في النظام إلى الترويج لرسالتهم وجعلها قناعة dole‏ لترغيب 
الناس والمؤسسات باعتناق منطقهم. وإلى الاعتقاد والعمل فيما يتعلق بهذا المنطق 
(Dodge and Kitchin 2005)‏ كما عملت على إنتاج أجواء معيّنة يتم من خلالها 
"تغذية أنواع خاصة من الفكر والممارسة بحيث تبدو طبيعية ومرغوبًا فيها" Amin and)‏ 
(Thrift 2013: 5‏ وهي تغرس نوعًا خاضًا من الاستجابة العاطفية )2009 (Anderson‏ 
فمثل هذه الخطابات والأجواء سعت إلى إعادة صياغة العام وفق رؤية «Lol‏ وإعادة 
تشكيل "القضايه الفاعلينء المخاطر, المصالح» والرغبات التي تنتشر في الحقل السياسي 
وامشهد الاقتصادي" )4 :2013 (Barnett‏ 

وكما تم النقاش في الفصلين الثاني والثالث» فقد سعت نظم الجدال وامحاورة المتداخلة 
إلى الدفع بعمليات تطوير البنى التحتية للبيانات والبيانات المفتوحة مستخدمة النقاشات 
والمداولات حول JIL‏ ومشاركة البيانات» واستنساخها وإعادة استخدامهاء وحرية النفاذ 
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والوصول إليهاء والحكومة المفتوحة» والشفافيةء والمساءلة, وتنظيم المشاريع الاجتماعية, 
واقتصاديات السعة ووفورات حجم الإنتاج. وكما Q3‏ بيانه في هذه الحالات» OB‏ منحى 
النقاش وطريقة التداول قد تكون مدفوعة من قبل مجموعة من الأطراف المعنية التي قد 
تستخدم الحجج نفسها ولكن لتحقيق مرام مختلفة (Je)‏ سبيل «JUL‏ تستخدم منظمات 
ا مجتمع ال مدني وقطاعات الأعمال الكبيرة خطابات الشفافية والمساءلة لإتاحة بيانات الحكومة 
وفتحهاء ولكن أحدهما لأسباب مدنية والأخرى للانتفاع UL‏ من البيانات). فالأنظمة 
الخطابية إذا لم تكن Dar‏ نتاجًا فوقيًا من الدول أو الأعمال» ولكنها انتشرت وسنت من 
خلال العديد من القنوات الأصغر حجما )1978 ,1977 (Foucault‏ وقد جرى قبولها دون 
إشكالية من قبل الجماهيرء من ال مواطنين والمؤسسات الذين كان من السهل استمالتهم 
من خلال منطقهم. وبالأحرى» فإن الخطابات مفتوحة للتحديء والرد عليهاء ومقاومتهاء 
وتفنيدهاء ومخالفتهاء والتصدّي لهاء وإظهار عوارهاء وتقديم رؤى بديلة جديدة. وفي كلتا 
الحالتينء يستند المروّجون أو المعارضون لرؤى جديدة على السجل الزمني الممتد من الماضيء 
إلى الحاضرء وحتى المستقبل لدعم حججهم» وذلك باستخدام الأدلة والشواهد من جولات 
سابقة من التغير الاجتماعي والاقتصاديء إلى جانب التحديات الحاضرة: والتكهنات حول 
الكيفية التي يمكن أن تشكل الكيفية التي ستكون عليها الأمور خلال سنوات قادمةء في 
ظل سيناريوهات مختلفة» )2012 ,2011 .(Kinsley‏ ومن «Q3‏ جری تداول المشهد الخطابي 
عبر جولات من التفاوض باسم الصراع على الأفكار والسبل لهيكلة وتمثيل وعمل وتنظيم 
ا مجتمعات» في الحاضر والمستقبل. 


s‏ هذا الفصلء سيجري دراسة المبررات المنطقية للبيانات الكبيرة للجهات الحكومية 
وقطاع الأعمال. وقد تم تنظيم النقاش حول أنماط خاصة من النظم والأنشطة الاجتماعية 
بدلا من تنظيم الفصل بحسب مختلف الخطابات التي يشيع توظيفها للترويج لإشاعة 
اعت ماد البيانات الكبيرة على سبيل ELI‏ التبضّر والحكمة, الإنتاجية: القدرة التنافسية, 
الكفاءة. الفعالية» GSI‏ الاستدامة. والتوريق .(Securitization) gil‏ فالخطب 
تمتلك تأثيرها الأقوى عندما يجري تعبئتها وتوجيهها في مهام وقضايا معينةء والمثير في 
حالة البيانات الكبيرة هو أن جدالها هتد إلى جميع القطاعات والشرائح - الاجتماعية 
والسياسية» والاقتصادية» والبيئية؛ فهي واعدة من خلال تقدهها وسائل جديدة US‏ في فهم 
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وإدارة جميع جوانب حياة الإنسان. وهناء سيتمٌ مناقشة هذا الوعد فيما يتعلق بأربع 
مهام رئيسية هي: حكم الناس وتنظيمهم. وإدارة المنظمات» وتعزيز القيمة وإنتاج رأس 
JUI‏ وأخيراً إنشاء أماكن أفضل. وهذه مهام توضيحية فقط على سبيل الحصر وليست 
شاملة» حيث إن هناك العديد من التطبيقات الأخرى الممكنة: Le‏ في ذلك القضايا البيئية 
(انظر Mayer-Schonberger and Cukier 2013; Siegel 2013; Smolan and Erwitt‏ 
2012( وستتم مناقشة LAS‏ إعادة تشكيل البيانات الكبيرة للبحوث ف الفصل «JEJI‏ كما 
سيجري مناقشة الدعوات المضادة لتطبيق البيانات الكبيرة في الفصل العاشر. 


حكم الشعب وتنظيمه (Governing People)‏ 

الدولة هي مولدٌ ومستخدم رئيس للبيانات» فمنذ عصر التنوير سعت الدولة لإنشاء 
طرق أكثر منهجية» من جهة» لإدارة وحكم المجاميع LOIS UI‏ ومن ناحية آخرىء لتقديم 
الخدمات للمواطنين. فإحدى هذه الطرق الرئيسية التي هدفت من خلالها إلى أداء هذه 
الأدوار بكفاءة وفعالية كانت من خلال التدقيق والتقدير الكمي والنوعي للمجتمع - أي 
بناء معرفة مفصّلة لإنفاذ ولايتها القضائية والاختصاصية من خلال تطوير النظم الإدارية 
على نطاق واسع. بدعم من أجهزة فنية وتقنية متنوعةء تعمل على قياس وتتبّع فهرسة 
وتمييز البيانات عن الأفراد. والشركات» والمؤسسات,. وال مكونات الأخرى (انظر Alonso and‏ 
Starr 1987; Barnes and Hannah 2001; Desrosiéres 1998; Kitchin and Dodge‏ 
Porter 5‏ ;2011( إن «c L3]‏ 1515« 555239« وتحليل البيانات من اطهام الرئيسية 
في جميع مؤسسات الدولة» فهي تستخدم في تقييم الالتزامات والاستحقاقات للموضوعات 
السيادية وغير السيادية, والكشف وامراقبة عن الخروقات وعدم الامتثالء والتهرب» 
والغش. فيما يتعلق با معايير والالتزامات القانونية المعمول بها )1996 (Rose‏ فعلى 
سبيل «JUL‏ يتم في الدوائر الحكومية. وخاصة تلك المتعلقة بالتمويل والتجارة والرعاية 
الاجتماعيةء تحديد جميع المواطنين والكيانات وتتبّعهم. ورصد القضايا والاتجاهات من 
خلال التحديثات على سجلاتهم» وتعبين ملفاتهم التعريفية وربط بياناتها بهم» وتعقب 
المدفوعات. وإدارة انضباطهم والخدمات المقدمة لهم. أما في المدارسء فيؤخذ التسجيل 
لبياناتهم» واحتساب وتقييد الدورات الدراسية وعلامات الاختبارات» ويتمّ مكافأة الطلاب 
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ومعاقبتهم ET‏ لأدائهم وسلوكهم. وفي قطاع الصحة» يتم قياس حالة المريضء وتسجيلهاء 
والعمل على أساسهاء واحتساب وتقييم أداء المرافق الصحية. كما تعنى وكالات حكومية 
متخصصة أخرى بإنتاج وإدارة وتحليل ونشر البيانات التي لها بالغ الأثر في إفادة العمل 
الحكومي. على سبيل JELI‏ الوكالات الإحصائية, وهيئات المسح ورسم الخرائط الجغرافية, 
وأجهزة الاستخبارات التي تتعهّد ببرامج مستمرة لإنتاج البيانات من خلال أنظمة قياس 
مثل المسح والمراقبة. 


ولتعزيز ممارساتها الحسابية» سعت الدول» من جهة» لتبرير وترشيد نظمها وعملياتها 
على الموضوعات» ومن جهة أخرىء لتطبيق وسائل إدارية أكثر تعقيدًا وتفصيلا من أي 
وقت .(McNay 1994; Miller 2001) (ga Ls‏ فا مسعى الأول يشمل الخطابات حول 
الحكومة الفعالة والقيمة مقابل «JU.‏ والمواطنة والتمكين» والعدالة ومكافحة الجرمة, 


الجماعي والمبادئ المشتركة. وتجابه هذه الخطابات من قبل أولئك الذين لديهم الرغبة في 
تقليل مستوى رقابة الدولة وسلصطتها مقابل الحريات الشخصية» والرقابة والضبط للنظم 
ا مجتمعية والاقتصادية» أو أن تكون أكثر انفتاحًا واستجابة وإنتاجية في ا ممارسات الحكومية, 
kaan‏ ذلك إتاحة البيانات التي يحملونها بشكل أكبر وأكثر حرية (انظر الفصل الثالث). 
أما امسعى الثاني فيتضمن تنفيذ أنظمة وتقنيات وبنى تحتية مصممة gazd‏ ومعالجة 
البيانات على نحو فعال وأكثر تطورًا من أي وقت مضىء متضمناً ذلك الأنظمة الأكثر ČLS‏ وقدرة 
في التعريف والتحديد (التواقيع والصور وبصمات الأصابع» وأرقام الضمان الاجتماعي وجواز 
السفرء وقوانين الضرائب» وأرقام الترخيص والحسابات» واممعلومات البيومترية» وا مستخدمين 
وكلمات السر والرموز البريدية... إلخ)ء والتي يمكن تشغيلها على نحو متزامن بشكل متزايد 
وعن بعد )2005 Hannah (1997: 178) JS «les .(Dodge and Kitchin‏ على أن أحد 
أشكل الحاكمية الأكثر فعالية يكون في الغالب من خلال تكوين "لفيف معقد من مجموعة 
بسط النفوذ والهيمنة...من خلال التعدادات والبيروقراطية والسياسات» وما إلى ذلك» وكم 
هائل من المؤسسات التخصصية مثل المدارس وأماكن العملء والأراضي ا ممتدة المجهولة اطثبتة 
بملايين من نقاط الانطلاق كأجهزة الصراف JYI‏ وكاميرات المراقبة» ونماذج تعبئة الطلب". 
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ولذاء فإن البيانات الكبيرة بأحد معانيها ليست Éi‏ جديدًا على الدول - وهي التي 
تعاملت طويلاً مع كميات هائلة من البيانات في إدارة الاختصاصات القضائية والقانونية 
كجزء جرى معالجته واتخاذ الإجراءات المتعلقة به في الوقت ال مناسب في حينه أو قريبًا منه 
كلما تفاعلت الوكالات مع الموضوعات. ومع ذلكء بنظر إلى البيانات الكبيرة باعتبارها أحدث 
مجموعة من التقنيات التي يمكنها توسيع وتحسين عمل الدول من خلال زيادة الانضباطية 
والشمولية للممارسات الحسابية لأعمالها. كما يتبنى البائعون» في بعض الحالات» خطاب 
الدفع بحلول البيانات الكبيرة بهدف بيع خدمات الدولة» وفي حالات أخرىء تأخذ الدولة 
بزمام المبادرة بشكل نشط. وف الوقت الحاضرء هناك نوعان من الإستراتيجيات الخطابية 
الرئيسية ا مستخدمة لتشجيع استخدام البيانات الكبيرة في السلطات الاختصاصية» يتعلق 
النوع الأول بالتحسينات على الإدارة العامة وتقليل التكاليف من خلال تعزيز الكفاءة 
التشغيلية» وتقليل تكلفة الأخطاء والاحتيال في إدارة المنافع» وزيادة في الإيرادات الضريبية 
عن طريق تضييق الفجوة الضريبية... وتحسين تخصيص التمويل في البرامج والخدمات ذات 
الجودة الأعلى» وزيادة المساءلة في القطاع العام» وإطلاع أفضل للمواطنين", مع تقديرات 
مقترحة بعائدات لحلول البيانات الكبيرة من الكفاءة التشغيلية المتعلقة بإدارة القطاع العام 
في القارة الأوروبية تعادل dia‏ وخمسين مليار دولار أمريكي (,61 :2011 Manyika et al.‏ 
2). وسيجري لاحقا مناقشة هذه الحجج بشكل أكبر فيما يتعلق بإدارة المنظمات وصنع 
أماكن أفضل. 

ويهتم النوع الثاني بأمن الدولة ومكافحة الجرهةء إذ تقوم جميع الدول بالمراقبة 
والرصد لأغراض الأمن والسلامة ومنع الجرهة والاعتقال من خلال أجهزة الشرطة وجمع 
المعلومات الاستخباراتية على نطاق أوسع. وقد تمّ تطوير الكيفية التي تنفذ بها هذه 
الأنشطة ها يتماشى مع التقنيات الجديدة - كالتنصت على الممكاممات الهاتفية واعتراض 
ا موجات الراديوية» والدوائر التلفزيونية المغلقة» والتصوير الجويء وصور الأقمار الصناعية, 
ومراقبة الإنترنت - والتي iS‏ ما جرى التبرير لها عند وقوع أحداث رئيسية مثل الحرب 
الباردةء والحوادث الإرهابية )2001 .(Innes‏ وف الآونة الأخيرةء قدّمت أحداث الحادي 
عشر من سبتمبر وما تبعها من الحرب على الإرهاب المبزر المنطقي لتغيير جذري في عمليات 
ا مراقبة والتأمين التي تقودها الدولة على نطاق واسع )2006 .(Amoore‏ وكان Úle‏ لبعض 
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الوقت أن تحليلات البيانات الكبيرة كانت عنصرًا أساسيا في تحسين هذه الأنشطة. وخاصة 
فيما يتعلق مراقبة الحدود وفحص Kitchin and Dodge 2006; Clements) öp ayl‏ 
2013( وقد كشفت تسريبات يونيو 2013 بشأن برنامج وكالة الأمن القومي الأمريي 
بريزم (PRISM)‏ المدى الذي وصلت إليه ممارسات مراقبة البيانات» وممارسات البيانات 
الكبيرة. والآليات التحليلية المستخدمة لجمع ومعالجة البيانات المتعلقة بالاتصالات اليومية 
لجميع المواطنين مثل المكامات اليومية» الرسائل النصية» رسائل البريد الإلكتروني» واستخدام 
الإنترنت» بدلا من اقتصارها على المواطنين الأحانب والقوى الخارجية أو لأهداف محددة 
.(Greenwald and MacAskill 2013; Risen and Lichtblau 2013)‏ فهذه التسريبات 
كانت هي الأحدث في سلسلة الكشف عن تجسس الولايات المتحدة على مواطنيها بشكل 
خفي )2009 .(Solove 2007 ; Bamford‏ والواقع» أن من الواضح أن الوكالات الاستخبارتية, 
والمتعاقدين العسكريين-الصناعيين» هم في طليعة مطوري الجيل القادم من أدوات البيانات 
الكبيرة لإدراك الكميات الهائلة من البيانات عالية السرعة. وقد استثمرت بكثافة في بناء 
الكفاءات والتقنيات والمرافق على سبيل «JULI‏ جرى استثمار 1.7 مليار دولار أمريي في 
مركز البيانات القائم في يوتا لمعالجة وتخزين البيانات الكبيرة التي تم جمعها من الولايات 
(Carroll 2013)‏ وبينما تسعى الدول إلى ترشيد تلك المراقبة ذات النطاق الواسع على 
مواطنيها من خلال الخطابات العامة الموجهة للأمن والسلامة. فإن الحقيقة الماثلة هي 
أنها قد caelo‏ الكثير من أجهزتها سرا لتنفيذها ودون اتباع للإجراءات القانونية الواجب 
العمل بها مما يقوّض اطثل العليا للدمقراطية القائمة على الشفافية والثقة Clements)‏ 
73. ومع ذلك» فمن غير المرجح على المدى القصير أن يقوم الغضب الشعبي العارم على 
هذه ال ممارسات والتجاهل الصارخ للحقوق الأساسية Jio‏ الخصوصية: على إبطاء أو إعادة 
تشكيل طريقة التعامل مع البيانات الكبيرة في هذا الجانب من الحكم» ولا لثني الخطابات 
التي استخدمت لتبريرها. 
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إدارة المنظمات :(Managing Organisations)‏ 
ماما كما تغيرت الدول وتفرعاتها الكثيرة في الحكم كالإدارات. السلطات المحلية 
الوكالات» الجيش» مقدمي الرعاية الصحية... إلخ مع مرور الوقت» واعتمادها ممارسات 
وتقنيات إدارية جديدة لإعادة تشكيل الكيفية التي يجري بها تنظيمها وتشغيلهاء «Jib‏ 
قامت شركات الأعمال والكيانات المؤسسية الأخرىء مثل منظمات غير الحكومية والهيئات 
التطوعية والمجتمعية. والجمعيات الخيريةء والأحزاب السياسية... إلخ. فالبيانات المتعلقة 
بمهامها الأساسية تشكل أحد الجوانب الأساسية لكيفية فهم هذه المنظمات لنفسها ودوائرها 
الانتخابية» وكيفية اتخاذ القرارات بشأن عملياتها الحالية والمستقبلية. كما أن البيانات 
تقذم الإثبات والدليل للإنتاج xl‏ الذي يستخدم لإدارة المنظمة بشكل أكثر كفاءة 

وفعالية» وتنافسية» وإنتاجية» وتحديد المنتجات والأسواق الجديدة (انظر القسم التالي). 


وهكذاء أصبحت نظم ا معلومات على مدى السنوات الستين الماضية من البنى التحتية 
الأماسية لجميع المنظمات على اختلاف أحجامها مما يمكنها من تتبّع وإدارة المجاميع البشرية 
المعقدة كالموظفينء الداعمينء المانحين, والعملاء والمكونات» والسلع الأساسية» والبنى التحية 
عبر الزمان والمكان» وتمكينها من توسيع نطاق عملياتها من المستوى امحلى إلى المستوى العالمي 
(Castells 1996; Dicken 2003)‏ فنظم المعلومات تتيح تشغيل المنظمات بشكل أكثر ذکاء 
وإنتاج وفورات كبيرة من تكاليف قاعدتها التشغيلية. وهناك ثلاثة من هذه النظم المعلوماتية 
ا مبنية على البيانات والتي 3 اعتمادها على نطاق واسع: نظم تخطيط موارد المنظمات (ERP)‏ 
ونظم إدارة سلسلة التوريد (SCM)‏ ونظم إدارة علاقات العملاء (CRM)‏ وتسهل هذه 
الأنظمة قدرًا أكبر من التنسيق والضبط داخل المؤسسة. ومع ا منظمات الأخرىء والعملاء. على 
سبيل «JEU‏ ينظم ويجمع نظام تخطيط موارد ا منظمات العديد من قواعد البيانات والأنظمة 
المتعلقة بالشراء التخزينء الجردء النقلء التسويقء ا محاسبة» إدارة شؤون ال موظفين وإعداد 
قوائم المرشحينء إدارة المشاريع: والعلاقات مع العملاء في نظام واحد شامل يضمن بصورة 
سهلة وتلقائية توافر البيانات والعمليات من جزء واحد من الأعمال لجزء آخر Dery et al.)‏ 
Grant et al. 6‏ :2006). كما تستخدم نظم إدارة سلسلة التوريد (SCM)‏ بأكبر قدر 
من الكفاءة لتنظيم اطمشتريات» والحركة» وإدارة وتخزين المواد من الموردين من الشركة وحتى 
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الزبائن )2012 à (Chopra and Meindl‏ حين تسعى نظم إدارة علاقات العملاء (CRM)‏ 
إلى بناء علاقات شخصية مع العملاء من خلال جمعها أنماط الحجوزات والمشتريات السابقة 
لهم» وعرض التفضيلات والخدمات ال ممكن الاستفادة منها خلال زياراتهم» والاستفادة منها في 
تقديم مکافات الولاءء والعروض dold‏ والترقيات» وتقديم التوجيهات للموظفين والأنظمة 
ليظهروا مظهر العارف بالعميل )2005 .(Sigala‏ وقد Brynjolfsson et al. (2011) si‏ من 
خلال دراسة شملت 179 شركة من شركات التداول العام الكبيرة على اعتماد هذه الشركات في 
اتخاذ القرارات اممبينة على البيانات Cue (Data Driven Decision- DDD)‏ يكون الناتج 
والإنتاجية أعلى ها يراوح بين 1-0 las X‏ هو متوقع عند الاعتماد على استثماراتهم الأخرى 
وطرق استخدام تقنية ال معلومات. 


وينظر إلى البيانات الكبيرة من قبل العديد على أنها المرحلة التالية في العملية الجارية 
التي تسعى إلى الكفاءة التنظيمية والبنى التي تعرز الميزة التنافسية» مع الحد من المخاطرء 
والتكاليف. والخسائر التشغيلية. وتحسين تجربة العملاء. فالذي توفره البيانات الكبيرة هو 
الإمكانية الشاملة وال مفصّلة لغاية إدراك جميع جوانب عمل المؤسسة بشكل آني ولحظي. 
وكما افترضت جماعة الضغط مؤسسة تك أمريكا ):2012 TechAmerica Foundation‏ 
12(« فإن البيانات الكبيرة ستضع الأساس: لاستبدال أو دعم عمليات اتخاذ القرار البشرية 
بخوارزميات آلية» مما يعمل على الحد من أوجه القصور داخل المنظمات؛ ويوجد الشفافية؛ 
ويحسن الأداء من خلال تمكين التجريب لاكتشاف الحاجات وإظهار التباينات؛ وتحسين العائد 
عن الاستثمار (ROI)‏ لاستثمارات تقنية المعلومات» وتحسين عملية اتخاذ القرار والتشغيل 
الذي؛ وتوفير قدرات تنبؤية لتحسين مخرجات المهام؛ والحد من التهديدات الأمنية والجريمة؛ 
والقضاء على الهدرء والاحتيال» وإساءة الاستخدام والمعاملة؛ وابتكار نماذج أعمال وخدمات 
مستفيدين جديدة. 

وبعبارة أخرى» ستوفر البيانات الكبيرة معرفة لحظية غاية في الدقة المفصّلة لكبار 
ا مديرين في جميع مناحي منظماتهم والتي يمكنهم من خلالها صياغة دورات عمل محكمة. 
وستمكن البيانات الك اللنظمات عن أن 3.55 das id das cs AST‏ .18,53:85 
وذكية في كيفية تنظيمها وتشغيلها )2011 (Manyika et al.‏ 
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ومثال على كيفية التوظيف الناجح للبيانات الكبيرة من قبل منظمة غير تجارية 
لإعادة هيكلة وإدارة عملياتها الحملة الانتخابية لباراك أوباما عن الحزب الدهقراطي. 
فكما أشرنا في الفصل الرابع» فقد تبنت الحملة الانتخابية لأوباما البيانات الكبيرة» من 
خلال جمع مجموعة هائلة من البيانات من مصادر متعددة وإنتاج بيانات اقتراع معتبرة 
احظا ف الوقت «cial‏ .من أجل إذارة رذ الف وتشكيل الإسترافيسة: «Dele ls‏ 
ومهام العاملين والمتطوعين. واستنادًا إلى تحليل الأداء عام YA‏ فقد نمت مجموعة 
تحليلات البيانات للحملة الانتخابية لأوباما للعام ۲١٠۲‏ في الحجم خمسة أضعاف عنها في 
Y**A dla‏ متضمنة KE‏ تقنيين جرى التعاقد معهم من سوق الصناعة )2012 (Scherer‏ 
وقد Cua‏ هذه المجموعة العلائقية بين البيانات التي Q3‏ جمعها من مصادر مختلفة 
بحيث أمكن ربطها lua‏ بشكل أكثر فعالية. كما طوّروا تطبيقات للحملة الانتخابية وجرى 
استخدام شبكات التواصل الاجتماعي مثل فيسبوك للدفع باتجاه التسجيل للانتخاب 
والحصول على التصويت لصالحهاء وتشيت ملفات تعريف الارتباط (Cookies)‏ الخاصة 
بهم وتلك المتعلقة بأطراف تم التعاقد معها على أجهزة الزائرين بلوقعهم الإلكتروني 
لجمع البيانات عنهم gz39‏ عاداتهم على الشبكة )2012 (Crovitz 2012; Kaye‏ 
كما قاموا بتحسين تصنيفاتهم التعريفية وتوقعات النماذج التنبئية وكيفية استخدام 
المعلومات الناتجة عن تحليلاتهم لتوجيه الحملة. بالإضافة إلى اختبار وصقل طرق زيادة 
التمويل لدعم الحملة (Scherer 2012) ÜL‏ كما أضافوا وعالجوا البيانات الجديدة 
بشكل مستمر مع تشغيل لأنظمة المحاكاة للتنبؤ بالنتائج وأفضل الردود. وكما صرّح 
أحد مسؤولي الحملة: "لقد شغلنا نموذج المحاكاة 77,0٠٠‏ ألف مرة في كل ليلة" لتحديد 
احتمالات الفوز في كل ولاية متأرجحة". وفي كل صباح يصل إلينا الناتج» هذه هي فرص 
نجاحكم في الفوز في هذه الولايات» وبهذه الطريقة تم تخصيص الوارد (مقتبس عن 
(Scherer 2012‏ لقد حصل فريق أوباما على مزايا مهمة عن منافسيهم من خلال 
التشغيل ال مستمر لمجموعات قواعد البيانات المتغيرة من خلال خوارزميات متطورة, 
adeg‏ أشار )246 :2012( Issenberg‏ إلى أن حملات أوباما الانتخابية كانت "ا مجموعة 
السياسية ا0 ou e LT‏ ا E ae‏ على السانات والممارسة دة 
الصارمة ". وهذا هو وعد الدعاة للبيانات الكبيرة بأن الفوائد العائدة عنها كالتي اكتسبها 


ثورة البيانات البيانات الكبيرة» والبيانات المفتوحةء والبنى التحتية للبيانات» والنتائج المترتبة عنها ۲۹ 


الفصل السابع 


الحزب الدهوقراطي من البيانات الكبيرةء لها أن تتحقق لجميع ال منظمات وغيرها من 
شركات قطاع الأعمال. 


:(Leveraging Value and Producing Capital) JU تحصيل القيمة وإنتاج رأس‎ 


فضلاً عن جعل الشركات أكثر كفاءة وفعالية في إدارتهاء ga‏ الترويج بكثافة للبيانات 
الكبيرة لتكون وسيلة لرفع مستوى القيمة الناتجة من أنشطة الشركة وعلاقاتها مع الموردين 
وا مستهلكين. وف الواقع. وكما أشار )2011( Gantz and Reinsel‏ فإن المحرك الرئيسي 
للبيانات الكبيرة ليس تقنيًا؛ ولكنه مالي مع الوعد بالمزيد من الكفاءة والأرباح. ومن ثم 
فإن اعتماد حلول البيانات الكبيرة هو إستراتيجية لإدراك تراكم رأس UU‏ غير الممستغل 
بطريقة تقدم عائدا كبيرا من الاستثمار وتوفير ميزة تنافسية );2011 Manyika et al.‏ 
.(Zikopoulos et al. 2‏ وهناك العديد من الطرق التي يمكن من خلالها لحلول 
البيانات الكبيرة أن تضفي الذكاء للشركات وبطريقة يمكن معها أن تنمو مبيعاتها وأرباحها. 
فمع الأخذ لقطاع البيع بالتجزئة «JS‏ حدّد )2011( Manyika et al.‏ ستة عشر حلاً 
مقسّمة إلى خمسة أنواع - التسويقء والترويج» والعمليات» وسلسة التوريدء ونماذج الأعمال 
الجديدة - يمكن لكل منها تحصيل مكاسب محتملة في مجال المبيعات والكفاءة (انظر 
الجدول .)۷-١‏ وهي تشمل إنتاج بيانات عبر الشركة وتطبيق آليات التحليل من أجل 
تقسيم السوقء والتصدي لعزوف العملاء والموظفين» وتحسين المدخلات المختلفة (على 
سبيل المثالء المكونات» والعمالة: والمرافق) وتؤدي من ثم إلى بناء مختلف التشكيلات 
والنماذج التنبئية للإجابة عن مجموعة متنوعة من الأسئلة من قبيل: 


٠‏ هل يتم الاتصال بالعميل آم لا (التسويق المستهدف)؟ 

٠‏ هل يتم تقديم عروض للاحتفاظ بالعميل آم لا (المحافظة على العملاء)؟ 

٠‏ أي نوع من الإعلان أو اختيار الكلمات / الصور أو المنتج تقدم للعميل (انتقاء المحتوى)؟ 
« أي قناة ينبغي الاتصال من خلالها بالعميل (اختيار القناة)؟ 

٠‏ هل يتم تقديم عرض أعلى أو أقل Gaw‏ للعميل (التسعير /الخصم المتغير)؟ 

٠‏ هل يتم شطب جزء أكبر من الدين عن المقترض (التحصيل)؟ 
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da e‏ يتم تقديم حد اثتماني أعلى أو dol‏ أو معدل فائدة للعميل (مخاطر الائتمان)؟ 
(Siegel 2013)‏ 

وللتركيز على نوع واحد من أنواع الحلول الخمسة التي قذمها )2011( «Manyika et al.‏ 
وهو التسويقء يمكن استخدام عدد من آليات التحليل وأدوات إدارة البيانات الكبيرة 
الموزعة في أربعة محاور هي: التوحيد والاختزال» التقسيم والتجزئةء المطابقة. والتحسينء 
وذلك لإدارة ومعالجة وتحليل وتفسير البيانات من أجل تلبية الأهداف (انظر شكل (V - ١‏ 
إن هدف التسويق السلوي هو بيع البضائع والخدمات بصورة أكثر فعالية للأفراد والعملاء 
«Lus‏ علاقة طويلة المدى معهم من أجل الحفاظ على عاداتهم وذلك من خلال الانسجام مع 
خصائصهم» وسلوکهم» ومیولهم» ورغباتهم )2011 (Schwartz and Solove‏ فمن خلال 
بناء الملفات التعريفية الفردية للأشخاص ودمجها مع التحليلات التنبئية» تسعى الشركات 
إلى تقديم تجربة شخصية من خلال التسويق الجزثي للمنتجات والعروض الخاصة. وقي 
سبيل ذلك» تسعى الشركات إلى توقع نية العميل في الشراء وتسهيل تحقيقهم لهذه النية 
بلطف» مع السعي لبناء ولاء العملاء في الوقت نفسه )2013 .(Minelli etal.‏ وقي ذات 
«Ll‏ زعم Bill Stensrud‏ أن "الموزعين يستخدمون البيانات الكبيرة في محاولة للحصول 
على المستهلكين" ( مقتبس في 24 :2010 (Bollier‏ 

وقد 3 بالفعل تنفيذ مثل هذا النهج للبيانات الكبيرة من قبل عدد من تجار التجزئة 
Uie‏ وول مارت وتيسكو. حيث تنتج مثل هذه السلاسل من المتاجر كميات هائلة من 
البيانات Gags‏ من خلال نظم تخطيط موارد المنظمات (ERP)‏ وإدارة سلسلة التوريد 
(SCM)‏ وإدارة علاقات العملاء (CRM)‏ الخاصة بهاء ا في ذلك ربط منافذ المبيعات 
بالزبائن من خلال بطاقات الولاء والاتتمان ( في حالة وول مارت هناك ما يقارب YW‏ 
مليون معاملة (Las?‏ واستخدامها لوضع إستراتيجيات أفضل للأسعار. ومخططات التخزينء 
وإعداد قوائم امموظفين» ومراقبة المخزون» والحملات الإعلانية» وتكاليف امموردء وتحديد 
مواقع جديدة للتخزين والمنتجات....إلخ» واقتطاع حصة من سوق منافسيها عند القيام 
بذلك )2010 .(Bollier‏ وعوضا عن إجراء مسوح عينية ضيقة ودراسات استقصائية باهظة 
التكلفة, لاستطلاع آراء ا مشاركين عن ماذا سيفعلون» وما هي القيمة المعتبرة بنظرهم» تقوم 
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البيانات الناتجة عن العمليات والتصفح على الشبكة بالكشف عن هذه المعلومات عبر 
جميع ا مستهلكين. فالفوائد المتوقعة مرتفعة. حيث يشير )2011( Manyika et al.‏ إلى 
أن البيانات الكبيرة يمكن أن تزيد هوامش التشغيل لتجار التجزئة بنسبة T‏ في «aU‏ وقي 
حين أن هذه الحلول المتعلقة بمبيعات التجزئة والتسويق من ال ممكن أن تتوفر في مختلف 
القطاعات. فإن درجة بروزها يختلف من قطاع لآخر بين مختلف القطاعات الأكثر استفادة 
من حلول معينة (انظر الجدول (V-Y‏ 

(V - ١( الجدول رقم‎ 


أنماط ذكاء البيانات الكبيرة للشركات 


التسويق البيع العابر للحدود (باستخدام المواقع الجغرافية للزبائنء وتاريخ الشراء 
(Marketing)‏ والتفضيلات» وا لمعطيات الأخرى لزيادة متوسط حجم الشراء) 


التسويق القائم على الموقع (باستخدام الموقع الحالي بشكل آني أو لحظي. 
على سبيل JELI‏ نظام تحديد المواقع الجغرافية في الهواتف ASII‏ 
واستهداف الزبائن الموجودين في المتاجر أو بالقرب منها) 
تحليل السلوك داخل المتاجر (تتبّع الهواتف الذكيةء وسلال التسوّقء وامراقبة 
امرئية للمساعدة eam à‏ مخطط توزيع المتجرء £539 «leal‏ ومواضع 
الأرفف لزيادة المبيعات) 
التقسيم الجزئي للعملاء (استخدام تاريخ الشراء والتصفح لاستهداف العملاء 
بشكل فردي بالإعلانات والعروض الخاصة) 
التحليل العاطفي (تتبّع ورصد آراء العملاء على مواقع التواصل الاجتماعي 
لتحديد ميلهم تجاه منتج ما وتعديل الحملات التسويقية بشكل مناسب) 
تعزيز تجربة العملاء مع تعدد القنوات (إنشاء تجارب وفهارس على شبكة 
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التبضع تحسين التشكيلة (تخصيص البضائع لحفظها في أي من المتاجر استنادًا إلى المواقع 
(Merchandising)‏ | الجغرافية المحلية, وانطباع المشترين وسلوكهم, والحقائق المحلية الأخرى) 
تحسين التسعير (باستخدام السلوكيات الشرائية والجغرافية لاتخاذ قرارات 
التسعير في مختلف المواقع لزيادة المبيعات / الأرباح) 
تحسين التموضع والتصميم (باستخدام السلوك داخل المتجر والتفاعلات على 
الموقع الإلكتروني لتوجيه عملية تصميم ال موقع / المتجر وأماكن وضع البضائع 
لزيادة المبيعات) 


العمليات شفافية الأداء (التحليل المفضل» بشكل آني أو لحظي على نحو متزايدء لتحديد 
(Operations)‏ مدى أداء «obe‏ والطمتاجرء والموظفين) 
تحسين مدخلات الموظفين (احتساب ال مستويات المثلى للتوظيف وجدولة 
المناوبات لتفادي فرط التوظيف أوشح القوى العاملة) 
(Supply Chain)‏ | ودورات المبيعات الفصلية» والأحداث والظروف المحلية لضمان مستويات 
مناسبة من ال مخزون المطلوب) 


تحسين التوزيع والدعم اللوجستي (تحديد مواقع البضائع بشكل آني أو 
لحظيء واحتساب مسارات الطرق الأكثر ملاءمة وكفاءة من حيث الوقت 
والوقود» ومراقبة سلوك السائقين» وجدولة أعمال الصيانة) 


مفاوضات ا موردين (باستخدام البيانات المتعلقة بتفضيلات المستهلكين 
ومشترياتهم لإبلاغ مزودي المنتجات) 


نماذج الأعمال خدمات مقارنة الأسعار (تقديم خدمات مقارنات شفافة من أطراف ثالثة 
الجديدة New)‏ للزبائن لأسعار المنتجات بشكل آني أو لحظي عبر مختلف تجار التجزئة) 


als Business Models)‏ اا عل الوب dal jl)‏ الاين يقدموق اماف قي 


مضافة مثل الوصول إلى الباعة 2,5« ومعلومات الممنتجات» والمراجعات 
الناتجة عن المستهلكين» ومقارنات الأسعار) 





.Manyika et al.2011:67-71 المصدر : جمعت من‎ 
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مقتبس من "البيانات الكبيرة: آفاق جديدة للابتكار والمنافسة والإنتاجية"» (معهد 
ماكينزي العاطي (May 2011) Mckinsey Global Institute‏ 


.(www.mckinsey.com/mgi.Mckinsey&Company) 


وإضافة إلى الدفع بالفوائد المتوقعة. سعى دعاة البيانات الكبيرة أيضًا إلى دعم اعتمادها 
من خلال تسليط الضوء على عواقب فشل الاستثمار فيها. على سبيل JULI‏ أشار Manyika‏ 
et al. (2011: 6)‏ إلى أنهم: "يتوقعون أن يرونء عبر القطاعات» تحقق القيمة التي تعود 
على المستخدمين الرئيسيين للبيانات الكبيرة على حساب المتقاعسين عنها"» وبعبارة $55« 
سوف يتخلف أولئك الذين لا يستطيعون التأقلم واعتماد حلول البيانات الكبيرة عن الركب 
ويتعرضون للتعثر والأفول؛ لأنهم سيفقدون حصتهم في السوق. وبغض النظر عما إذا كان 
استخدام الخطابات للدفع أو الجذب» فقد أضحت البيانات الكبيرة للأعمال منتشرة داخل 
التيار الرئيسي ووسائل الإعلام التجارية منذ العام 2012م, وبالنظر لفوائدها ال موصوفة: يبدو 
أن البدء في تطبيقها على نطاق واسع سيمثل dle JI‏ التالية للابتكار التقني وذلك بصورة 
مؤكدة. 
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(V - ١( الشكل رقم‎ 


التسويق والبيانات الكبيرة 
أهداف المسوقين قدرة ا منصة 


العمليات 


الأحداث 
إدارة علاقات العملاء 
مکالات الدعم 


© نظرة أحادية للعميل 


التوحيد والاختزال 


التكتل /التجميع 
حيازة البياناثت 


2 — اختيار الخصائ 
زيادة دقة الاستهداف 3 Es n‏ 
.3 2 


الرسائل الشخصية 
خوارزمات المطابقة 


S MES ©‏ 2 — حسابات المصفوفة 
3 تجزئة القيمة الأحادية 


التنبق 
خوارزميات التنبؤ 


6 الربحية العالية للحملة B‏ شجرة القرارات 
.2 الانحدار الخطي 





امصدر: مقتبس من 2012 -Claverie-Berge‏ 
تم إعادة الطباعة بإذن من المؤسسة الدولية لآلات «Juss MI‏ © المؤسسة الدولية لآلات الأعمال 


(International Business Machines Corporation) 
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الجدول رقم (V - Y)‏ 
فوائد البيانات الكبيرة لعشر صناعات مختارة 


ا مراقبة المتقدمة للحالة تحديد التصرف القادم الأمثل 
تجميع وتسعير السيارات الجديدة نمذجة الكوارث 
مطالبات الضمان الغش في المطالبات 
تحديد التصرف القادم الأمثل امراقبة المتقدمة للحالة 
تحليل سجل النظام مراقبة وتحسين الحفر 


الطاقة والخدمات 


تحليلات العداد الذي التحسين الآلي للأسعار 


التنبؤ بتوزيع الأحمال وجدولتها التشكيل المحلي 


منع الجرائم والتهديدات والتنبؤ بها ضمان الخدمة الأفضل 
تحليلات الاحتيال والنفايات وإساءة المعاملة ذكاء الشبكة 
استحداث منتجات وخدمات جديدة 
التدبير والتصرف بناء على الصحة العامة 
للمجتمع 
إشراك المستهلكين في رعايتهم الصحية 





( CIBM (n.d) el المصدر: أي بي‎ 


http://www-01.ibm.com/software/data/bigdata/industry.html 
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إيجاد أماكن أفضل: 

اخترع الناس واعتمدوا على مر التاريخ على تقنيات جديدة صممت لإنشاء الثروة 
وتحسين الحياة اليومية وتعزيزها. وقد أثرت العديد من هذه التقنيات بشكل كبير 
على طبيعة وهيكل وتنظيم us‏ الحياة المدنية والريفية» في الخدمات الخاصة المقدمة, 
والنقلء والاتصالات. وبناء البنية التحتية. فهذه التقنيات تحمل في كثير من الأحيان 
تأثيرات متناقضة وسلبية على سبيل ال مثال المصانع التي صنعت الثروات» ds‏ الوقت 
نفسه التلوث البيئي أيضاء أو أن تكون مبالغا فيها بحيث تتجاوز الطاقة الاستيعابية 
على سبيل JELI‏ الاكتظاظ أو الازدحام ال مروريء أو تنتج التبعيات التي لا يمكن أن 
تطاق على سبيل المثال» المسافات الطويلة بين مواقع السكن ومواقع العمل. إن تقنيات 
المعلومات والاتصالات (تكنولوجيا المعلومات والاتصالات) هي أحدث موجة من الأجهزة 
والبنى التحتية الجديدة التي أضحت جزءًا لا يتجزأ في نسيج البيئة التي نعيش بهاء 
ومعها مكوّن مهم من مكونات منطقها الاستطرادي وهو أنها تعمل على توفير الحلول 
للمشاكل الناجمة عن الدورات السابقة من التنمية التي قادتها التقنية - بحيث تجعل 
منها ASÍ‏ كفاءة واستدامة. ونظافة dsl‏ وإنتاجية.. el‏ - وكذلك إنشاء طرق جديدة 
LSU‏ للعمل في العام duis all cula eJ douzig daas‏ اللعلومات والاتصالات: 
على مدى العقود القليلة الماضية» باعتبارها pais‏ أساسيًا في إستراتيجياتها الإنمائية 
(Castells 1996; Graham and Marvin 1996; Kitchin 1998)‏ 


إن مفهوهم المدن الذكية هو تجسيد لهذه JE‏ 58 التي تقودها تقنيات المعلومات 
والاتصالات للتنمية aal‏ والذي يصف الأماكن التي تتكون بشكل متزايد وتراقب بواسطة 
الحوسبة المنتشرة والحوسبة في كل مكان» ويقود ضبط اقتصادها وإدارتها الإبداع» والابتكارء 
«Jis MI 3L 25s‏ من قبل أناس أذكباء,  Gall odas‏ الذكة 858a‏ بشكل مكف ومكن 
فهمها وضطها بشكل àl‏ أو لحظي؛ فهي تنتج» وتتبادل» وتدمج, وتستيلك: وتعمل على 
البيانات الكبيرة )2014 (Kitchin‏ إن مثل هذه البيانات الكبيرة p‏ هما شاملا d‏ 
ومفضّلاً بدقة لهذه المدن والمدخلات للأنظمة التي من شأنها بناء أماكن أكثر ملاءمة للعيشء 
dulo‏ ووظيفية» وتنافسية. ومستدامة )2013 .(Hancke et al. 2013; Townsend‏ فمثل 
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الفصل السابع 


هذه الرؤية للمدن الذكية يجري الترويج لها بشكل كبير من قبل عدد من أكبر مزودي 
خدمات البرمجيات في العام وشركات الأجهزة الرقمية (على سبيل «JULI‏ سيسكوء وآي بي 
«el‏ ومايكروسوفت» وإنتل» وسيمنزء وأوراكل» وساب) والتي اعتمدت بحماس من قبل 
المؤسسات البلدية والوطنية والعابرة للحدود التي تتوقع لتقنيات المدن الذكية أن تنتج 
تقدم اجتماعي -اقتصادي وتجدد المراكز المدنية لتصبح مراكز للابتكار والعمل Kourtit et)‏ 
(al. 2‏ وفي حين 3 بناء بعض مشاريع المدن الذكية من الألف إلى الياء (على سبيل 
JELI‏ سونغدو (Songdo)‏ أو مدينة مصدر ((Masdar City)‏ فإن معظم هذه المشاريع 
تدريجية: وتتألف من إعادة تجهيز للبنية التحتية القائمة مع تقنيات رقمية وحلول للبيانات؛ 
لأن الوظيفة الرئيسية للبيانات الكبيرة في كلتا الحالتين هي توفير تحليلات بشكل آني أو 
لحظي لإدارة كيفية جوانب وظيفة المدينة وتنظيمها. 

AJ‏ استخدمت هذه المراقبة وآليات تحليل البيانات الآنية واللحظية لعدد من السنوات 
في بعض القطاعات. على سبيل المثال» قيام العديد من اللمدن ببناء أنظمة النقل ASII‏ 
والتي تستخدم البيانات الناتجة عن شبكة من الكاميرات والنواقل والمتعلقة بحركة ا مرور 
حول نظام ما لتقديم تغذية راجعة مركز تحكم مركزي» وتستخدم مراقبة وتنظيم التدفق» 
وتعديل تسلسل حركة المرورء وحدود السرعة المسموح بهاء وإدارة العقوبات المتعلقة 
با مخالفات المرورية بشكل تلقان )20072 .(Dodge and Kitchin‏ وبالمثل. فقد ترصد 
وتراقب الشرطة مجموعة من الكاميرات وسجلات الحوادث الحية من أجل توجيه الموارد 
ا مناسبة لمواقع معينة للاستجابة السريعة وبكفاءة. كما هكن جمع البيانات المتعلقة 
بالظروف البيئية من خلال شبكة استشعار موزعة في جميع أنحاء المدينةء على سبيل 
«JULI‏ قياس وتتبّع تلوّث الهواءء ومستويات المياه» أو النشاط الزلزالي. وتستخدم العديد 
من الحكومات ال محلية نظم إدارية لتسجيل مشاركات الجمهور وتفاعله مع خدماتها. وفي 
جميع الحالات تقريباء كانت هذه الأنظمة معزولة عن بعضها البعض وتتعامل مع قضية 
واحدة ويتم التحكم بها من قبل وكالة واحدة. 

وفي الآونة الأخيرة. كانت هناك محاولة لجمع كل هذه الأنواع من المراقبة والتحليل في 
مركز واحد» وأن تستكمل بآليات تحليل عامة ومفتوحة على نطاق أوسع. على سبيل المثاله 
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قام مركز العمليات في ريودي جانيروء البرازيل» والذي تم إنشاءه بالشراكة بين حكومة 
المدينة وشركة آي بي cel‏ بتجهيز نظام على مستوى كافة أنحاء المدينة حيث يجمع البيانات 
من ثلاثين وكالة معاً في مركز موحد لتحليلات البيانات» ها في ذلك حركة ا مرور والنقل العام, 
والبلدية وخدمات المرافق. وخدمات الطوارئ. ونقاط جمع بيانات الطقس. وا معلومات 
المرسلة من قبل الموظفين والجمهور عبر الهاتفء والإنترنت» والراديو (انظر الشكل 27.2 
(Singer 2012c‏ هناء تعمل الخوارزميات وفريق من المحللين على معالجةء وتصورء 
وتحليل» ورصد كمية هائلة من بيانات الخدمة الحية» جنبا إلى جنب مع البيانات المجمعة 
مع مرور الزمن وكميات ضخمة من البيانات الإدارية التي تم إصدارها على أسس دورية 
بصورة css‏ وغالباً ما يتم ا مزج بين مجموعات البيانات معا للتحقيق في جوانب معينة من 
حياة المدينة والتغييرات الحاصلة فيها مع مرور الوقتء وبناء النماذج التنبئية فيما يتعلق 
بالتنمية والإدارة اليومية للمدينة وإدارة حالات الكوارث كالفيضانات. ويكمل هذا عن 
طريق منصة العمليات الافتراضية التي تمكن المسؤولين في المدينة من تسجيل الدخول من 
الميدان والوصول إلى المعلومات بشكل آني أو لحظي. فعلى سبيل المثالء هكن للشرطة 
في مشهد الحادث المروري استخدام dabl‏ لمعرفة عدد سيارات الإسعاف المرسلة للموقع 
وموعد وصولهاء وتحميل معلومات إضافية على الموقع (Singer 2012c)‏ وكان الهدف 
المعلن من عمدة «às al‏ إدوارد بايس (Eduardo Paes)‏ هو إسقاط الحواجز بين الإدارات 
وضم بيانات Js‏ منها إلى الآخر لمساعدة المنظومة بأكملها (Singer 2012c)‏ كما يجري 
تطوير مراكز مماثلة في أماكن ]4552 يصاحبها مجموعة من التطبيقات للمواطنين للوصول 
والاستفادة من بعض مناحي البيانات. 

أما بالنسبة لأولئك العاملين على تطوير واستخدام آليات تحليل متكاملة وآنية 
لبيانات dubl‏ فإن مثل هذه المراكز والتطبيقات توفر وسائل فعالة لاستشعار وفهم 
العيش في المدينة وإدارتها في الوقت الراهنء وتصوّر وتوقع السيناريوهات المستقبلية, 
وإجراء توزيع ال موارد بالاعتماد على الدليل وتسهيل التفكير المترابط عبر الحكومة 
(Flowers 2013; Kitchin 2014)‏ وبدلاً من اتخاذ القرارات IS al‏ إلى الكلام 
المتداول» أو الحدس والظن» أو المحسوبية. أو أدلة دورية / جزئية» فمن الممكن تقييم 
ما يحدث في (el‏ 235« والرد والتخطيط المناسب له. 


ثورة البيانات البيانات الكبيرة» والبيانات المفتوحة, والبنى التحتية للبيانات» والنتائج المترتبة عنها ۲۹ 


الفصل السابع 


الشكل رقم (V - Y)‏ 
لوسط مدينة ر 


مركز العمليا 


o 
ىا‎ 


يودي جانير 


9 


oit 00 لا‎ 
5303101340 30 011 


B 





[http://ipprio.rio.rj.gov.br/centro-de-operacoes-rio-usa-mapas-feitos-pelo-ipp : امصدر‎ 


v". 


ثورة البيانات البيانات الكبيرة» والبيانات المفتوحة» والبنى التحتية للبيانات» والنتائج المترتبة عنها 


المبررات الحكومية والتجارية للبيانات الكبيرة 


وعلاوة على ذلك» يوفر استخدام عينات كبيرة وربط أشكال متنوعة من البيانات 
تحليلا AS]‏ عمقاء وشموليةء وقوة. وقد أصبح من الممكن للدعاة Jil‏ هذه الأنظمة 
تطويرء وتشغيلء وتنظيم» وخوض غمار الحياة في المدينة على أساس قويء ودليل 
منطقي غير ضعيف. لا دليل انتقائي مبني على أسس إيديولوجية سياسية Flowers)‏ 
2013(. وهكذاء فثمة من يقولء إن استخدام هذه البيانات الكبيرة سيوفر الأساس 
طدينة أكثر فعالية. واستدامة» وتنافسية» وإنتاجية» وانفتاحاء وشفافية. إلا أن آخرين 
يحذرون من أن البيانات الكبيرة تشير إلى احتمالات الوصاية Big Brother"‏ "< وأشكال 
الحكم القائم على التقنية ((Technocratic)‏ وخصخصة (Corporatisation)‏ إدارة 
المدينة (انظر الفصل العاشر). 


الخلاصة: 

رسم هذا الفصل الدوافع الدعائية للبيانات الكبيرة فيما يتعلق بأربع مهام رئيسية 
هي: حكم الشعب. وإدارة المنظمات» وتعزيز القيمة وإنتاج رأس «JUL‏ وإيجاد أماكن 
أفضل للحياة (حيث سيجري مناقشة إمكاناتها بالنسبة للعلوم في الفصل التالي). وقد 
بيّنت المناقشة الكيفية التي يتم بها تأطير البيانات الكبيرة Gulu‏ واقتصاديًا (انظر الفصل 
الأول) وكيف يتم وضع مجموعة قوية من البيّنات والحجج العقلانية لدعم البدء في 
تنفيذ واعتماد تقنيات البيانات الكبيرة وحلولها. وتتضح قوة الأنظمة الخطابية التي 
يجري بناؤها من خلال النظر في الحجج المضادة - حيث من الصعب أن نقول إننا نريد 
أن نبقى في حالة أقل pas‏ وحكمة» وإنتاجية. وتنافسية: وكفاءة, وفعاليةء واستدامة, 
وأمنّا... إلخ. فإذا كانت البيانات الكبيرة تقدم كل هذه الفوائد. فإن دعاة البيانات 
الكبيرة يجدون من غير المنطقي عدم ا مضي قدمًا في تطوير نظم البيانات الكبيرة ودعمها. 
وبطبيعة الحال» فإن الحجج التي قدّمت هي ضيقة وانتقائية وتبتعد عمدا عن تسليط 
الضوء على الآثار السلبية ا محتملة فيما يتعلق بالحريات المدنية» ومراقبة البيانات» والفرز 
الاجتماعيء وأمن البيانات» وانفلات زمام التحكم وفرض السيطرةء والحكم الاستباقيء 
والحكم التكنوقراطي (القائم على التقنية) والخصخصة» وغلق التقنيات وعدم إتاحتها 
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بصورة SÍ‏ (انظر الفصل العاشر). فهذه هي à as‏ نظر أصحاب المصالح الخاصةء ولا 
سيما أولئك الذين يسعون لبيع تقنيات البيانات الكبيرة. والحكومات التي تسعى نحو 
رؤية الليبرالية الجديدة للحكم والتنظيم (الليبرالية الجديدة: هي فكر أيديولوجي Uie‏ 
تأييد الرأسمالية المطلقة وعدم تدخل الدولة في الاقتصاد.)» وليست وجهة نظر المواطنين 
أو المجتمعات التي من الممكن أنها لا تزال من دعاة البيانات الكبيرة والحوسبة في كل 
مكان» ولكنهم يتصورون أن استخدامها سيكون بطرق da ) o3‏ وتمكينيهء وتشاركية مع 
إخضاع التأثيرات الأكثر سلبية للرقابة والتنظيم. 


لقد jë‏ التحليل المعروض في هذا الفصل بالإيجازء مع توفير dab‏ شاملة لبعض الحجج 
التي تطرح. وما هو مطلوب في الوقت الحاضرء من خلال دراسات الحالة المحددة. هو 
تفصيل وتمحيص للأنظمة الخطابية التي تتكشف ويجري بناؤها. على سبيل JELI‏ فيما 
يتعلق بالترويج للبيانات الكبيرة في المدن الكبيرة. فهناك حاجة لرسم وتجزئة الكيفية 
التي تروج بها مختلف الخطابات الداعمة فيما يتعلق بأماكن محددة من خلال المجلات 
التجارية وا مواقع الإلكترونيةء والصحف اليوميةء واي مواد الترويجية للشركات» وسجلات 
الدولةء والبيانات السياسية... إلخ» وتقاطعات الأجندات المختلفة ومصالح ال معنيّين. وهذا 
يحتاج إضافة إلى تحليل الكيفية التي يتم بها التصدي JL‏ هذه الخطابات برؤى بديلة, 
وتحليل المعارضات والتداخل بين الحجج الخطابية وتتبّع تسلسل الكيفية التي تحولت 
بها مع مرور الوقتء والتحليل المقارن للمشهد الخطابي عبر مختلف البقاع أن يصاحبه 
تحليلٌ لآثار الخطابات على تشكيل الكيفية التي يعمل بها المجال ف الممارسة والنتائج 
dax‏ على تنفيذ حل البيانات الكبيرة. 

وبالنسبة فيما يتعلق بالنقطة الأخيرةء بين )2014( Salmon‏ بالتفصيل أنه بمجرد أن يتم 
تطبيق حل قائم على البيانات فإنه من النادر أن يحقق الفوائد التي توقعها المتحمسون 
والداعمون لذلك الحلء وغالبًا ما ينتج عن الحل مجموعة من القضايا الجديدة. وقال 
إنه توجه لقانون كامبل (Campbells Law)‏ الذي صاغه عام الاجتماع دونالد كاميل 
(Donald T. Campbell (1976‏ ليشرح هذه الظاهرة. فقانون كامبل ينص على: "إنه 
كلما كثر استخدام أي مؤشر اجتماعي كمي mua)‏ القرار الاجتماعيء كلما كان الموضوع 
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تحت ضغوط الفساد وأكثر عرضة للتشويه وإفساد العمليات الاجتماعية التي يهدف 
إلى رصدها." أو بحسب صياغة سلمون نفسه: "كلما جرى تشغيل حقل بنظام ما بشكل 
SÍ‏ أوجد هذا النظام المزيد من الدوافع للجميع (الموظفينء والعملاء والمنافسين) لتغيير 
سلوكهم بطرق منحرفة ضارة - مما يوفر أكثر من الشيء الذي تم تصميم النظام لقياسه 
وإنتاجه. سواء كان لذلك أي قيمة في الواقع "Y el‏ 

وبعبارة أخرىء يبدأ الناس في اللعب على النظام بعقلانية واعتبار المصلحة ASII‏ 
ولكن في كثير من الأحيان بطرق غير متوقعة لإفساد المقايبسء والخوارزميات» وعمليات 
صنع القرار الآلي. على سبيل JUL‏ أشار )44 :1995( Porter‏ إلى أنه "عندما يتم 
الحكم على مديري الأعمال من خلال حساباتهم» فإنهم يبدؤون التعلم على LAS‏ 
تحسين حساباتهم, رها من خلال بعض الحيل من قبيل تأجيل الصيانة اللازمة وغيرها 
من التكاليف ذات المدى الطويل". ونتيجة لذلكء فإنه في حين يمكن أن تتحول كيفية 
إدارة وتشغيل ال منظمات والحكومة؛ لتصبح قاثمة على البيانات ومقاييس الأداء فإنه من 
deae]‏ أن ذف ذلك DEI‏ معدوعة دقر مع dues VIS ST adis du‏ نين الحاكمية: 
ليس بالضرورة أن تكون إيجابية في مجملها. 

ولذاء تحتاج دراسات البيانات الكبيرة وآثارها إلى الانفتاح لعرض السياسات والأجندات 
الكامنة للبيانات الكبيرة في مختلف السياقات وتوفير أساس لزيد من المحادثات المعيارية 
حول هذا النوع من عواطم البيانات الكبيرة التي قد نرغب في العيش بها. فهذه الأنواع 
من المحادثات هي قيد التطوير في الوقت الحاضرء ويرجع ذلك بشكل dem‏ إلى حداثة 
التطورات وسرعة وقوعهاء وأيضًا بسبب هيمنة الأطروحات المبالغ بها عن البيانات الكبيرة 
ومكائد أصحاب المصلحة المعنيين بها. ومع ذلك تضل الحاجة قاثمة Jib‏ هذه الأحاديث 
بالنظر إلى أن البيانات الكبيرة تعيد تشكيل الطريقة التي يجري بها حكم المواطنينء 
وتنظيم المواقع» وإدارة المنظمات» وعمل الاقتصاديات» وممارسة العلوم. 
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الفصل الثامن 
إعادة صياغة بحوث العلوم» والعلوم الاجتماعية» والعلوم الإنسانية 


The Reframing of Science, Social Science and) 


(Humanities Research 


2 حديث مجلة الإيكونيميست 2 العام 2010 Sò «e‏ سنان (Sinan Aral) JIJ‏ 
أستاذ إدارة الأعمال في جامعة نيويوركء أن "الثورات ف العلوم DE‏ ما يسبقها ثورات في 
القياس" (مقتبس عن 2010 .(Cukier‏ إن هذا الفصل يستكشف مدى انطباق ملاحظة 
ULT‏ فيما يتعلق بالبيانات الكبيرة: والبنية التحتية للبيانات» والبيانات المفتوحة» وتأثيراتها 
فيما يتعلق بكيفية مقاربة البحوث والاكتشافات الأكادهية من منظور فلس في ومنهجي. 
deg‏ وجه الخصوص, يقوم هذا الفصل بدراسة كيفية تحدى توافر البيانات الكبيرة والبنى 
التحتية للبيانات إلى جانب الأدوات التحليلية الجديدة للنظريات والعلوم المعرفية القائمة 
في مختلف التخصصات- الكيفية التي يتم بها طرح الأسئلة وكيفية الإجابة عنها- ويؤدي إلى 
نشوء مجالات وتخصصات جديدة. وهكذاء يستكشف هذا الفصل ما إذا كانت التغيرات 
التي تطرأ على الطريقة التي يتم بها إنتاج وإدارة وتحليل المادة الخام للمعلومات وا معرفة 
ستؤدي إلى تغيير جذري في فهم وممارسة المبادئ الأساسية التي تقوم عليها العلوم» والعلوم 
الاجتماعية والإنسانية. وبعبارة أخرى. هل تقود ثورة البيانات إلى نقلة نوعية في المجالات 
الرئيسية للعلوم والبحوث؟ 
Jie‏ النموذج (Paradigm)‏ كما حدده كوهن )1962( Kuhn‏ وسيلة مقبولة لاستجواب 
العام وجمع ا معرفة المشتركة بين نسبة كبيرة من الباحثين في اختصاص معين في لحظة زمنية 
معينة. ويتشارك الباحثون العاملون ضمن نطاق هذا النموذج في فلسفة واحدة. واستخدام 
مجموعة من الأساليب الشائعةء وطرح الأسئلة والإجابة عنها للعمل على بناء ا معرفة بصورة 
تدريجية. ومن ثم» فإنهم بميلون إلى تفضيل التصنيفات» والمعارف, والنظريات» والأساليب» 
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والأطر الأخلاقية والعقائدية نفسها أو القريبة من بعضها البعض. ومع ذلك فقد أشار 
كوهن» وبصورة متكررةء إلى بروز طرق جديدة للتفكير تتحدى النظريات والمناهج المقبولة 
والمعمول بها. على سبيل JULI‏ فإن النظرية النسبية لآينشتاين جابهت» Is‏ حد كبير. حلت 
محل نظرية نيوتن في الفيزياء. Jis‏ أحدثت نظرية التطور لداروين تغبيراً جذرياً في 
الفكر النظري للعلوم البيولوجيةء كما تحدّت المذاهب الدينية في معتقدات النشوء والخلق. 
وفي كلتا الحالتين» فقد تمسك بعض الناس بالطرق الممتبعة في التفكير وتشبثوا بهاء في حين 
انتقل آخرون إلى الفكر الجديد, والذي سرعان ما أصبح الفكر ا مهيمن. وفي بعض المجالات 
الأكادممية, هناك القليل من الأدلة على نماذج عاملةء لا سيما في العديد من العلوم الاجتماعية, 
مثل ole‏ الاجتماع والجغرافيا البشرية» حيث تم تطبيق مجموعة متنوعة من المناهج 
الفلسفية على سبيل «JUL!‏ الوضعية (Positivism)‏ والظواهرية (Phenomenology)‏ 
والبنيوية ((Structuralism)‏ وما بعد البنيوية ...(Poststructuralism)‏ وغيرهاء وقامت 
العديد من هذه المعسكرات النظرية بطرح آراء متعارضة بشأن أفضل السبل لفهم العام. 
وفي مجالات أخرىء مثل العلوم» كان الاجتماع أكثر على وحدة ال منهج العلمي المتبع معززاً 
باختبار الفرضيات للتحقق منها أو نفيها. وهذا لا يعني. مع EUS‏ عدم تحؤل أو 4S3‏ 
الطريقة التي تعمل على تصوير ونشر المنهج العلمي بشكل $592« ووجود بعض النظريات 
المتنافسة فيما يتعلق بشرح ظواهر معينةء فالنظريات يمكن أن تختلف حول الظواهر 
ولكنها تشترك في نفس النهج الأوسع للمساعي العلمية. 

وقد بين جيم غراي «(Jim Gray)‏ على سبيل المثال LS)‏ هو مفصل في Hey et al.‏ 
2009( تطور العلوم من خلال أربعة نماذج. حيث أشار إلى أن النموذج الرابع ما زال في 
بداياته ولكن هو نتيجة لثورة المعلومات المنتشرة (انظر الجدول 8.1). وبخلاف طرح 
كوهن» تحدث التحولات في النموذج لأن النموذج السائد في العلم لا يمكنه تفسير بعض 
الظواهر ال معينة أو الإجابة عن الأسئلة الأساسية» ومن ثم تبرز المطالبة بإعادة صياغة 
أفكار جديدة, فتحولات غراي تأسست على التطورات الجارية في أشكال البيانات وتطورات 
الأماليب التحليلية الجديدة. وسيستكشف هذا الفصل إلى أي مدى Gb‏ وجود النموذج 
الرابع في العلوم» وإلى أي مدى تقود ثورة البيانات إلى نظريات معرفية بديلة في العلوم 
الإنسانية والعلوم الاجتماعية. وبالنظر إلى المراحل الأولية نسبيا في ثورة البيانات المنتشرة, 
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فرها لن تتفاجاً بتباين الآراء حول تأثير البيانات الكبيرة» والبيانات المفتوحة؛ والبنى التحتية 
للبيانات» وتحليلات البيانات الجديدة على إنتاج نظريات معرفية جديدة» وسيستمر وجود 
مثل هذه التباين في الآراء. ولكنء لا مجال للشك في أن البيانات الكبيرةء والبيانات المفتوحة, 
والبنى التحتية للبيانات» وتحليلات البيانات الجديدة تطرح LLA‏ معرفية أساسية وذلك 
لأن استخلاص المعلومات الصحيحة وا مفيدة من طوفان البيانات لا يعد ببساطة قضية فنية 
يمكن التعامل معها من خلال حلول تقنية فحسب )2012 (Floridi‏ 


الجدول رقم V)‏ - ^( 


نماذج العلم الأربعة 


levi abi ches di B 


الرابع العلوم الاستكشافية يتسم بكثافة البيانات» الاستكشاف à‏ الوقت الحالي 
الإحصائي والتنقيب عن البيانات 





المصدر: تم التجميع من 2009 -Hey et al.‏ 


:(The Fourth Paradigm in Science) للعلم‎ zl JI النموذج‎ 


à‏ حين أن جيم غراي (Jim Gray)‏ تصور أن النموذج gol JI‏ في العلوم يتسم بكثافة 
البيانات واتساع المنهج العلمي المؤسس. إلا أن بعض العلماء الآخرين يرون أن البيانات 
الكبيرة أفسحت الطريق لبزوغ pas‏ جديد للفلسفة التجريبية (Empiricism)‏ حيث 
يمكن لحجم البيانات الذي تصحبه أساليب معينة أن يكشف عن الحقيقة الكامنة فيهاء وأن 
يمكن البيانات من أن تتحدث عن نفسها وهي متحررة من النظرية. وقد اكتسبت وجهة 
النظر الأخيرة الاعتمادية خارج المجمعات العلمية» وخاصة داخل دوائر «Jüss SI‏ ولكن 
أفكارها تأصلت وتجذرت في ام مجال الجديد لعلوم البيانات والعلوم الأخرى. فكلا المنهجين 
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يوفران تحدياً للمنهجية العلمية التقليدية إضافة إلى طرح نموذج بديل محتملء وفي هذا 
الجزء. سيتم دراسة الادعاءات العلمية لكلا المنهجين بشكل نقدي. 


عودة ظهور الفلسفة التجريبية :(The Re-Emergence of Empiricism)‏ 
بالنسبة «asi‏ فإن فلسفة النموذج الرابع هي ما أطلق عليه Brooks (2013 a)‏ 
«منهج البيانات» (Data-ism)‏ وهو محاولة التقاط أي شيء على شكل بيانات واستخلاص 
مستوى معين من التبصر منها: "فأي شيء يمكن قياسه يجب أن يتم قياسه... البيانات هي 
منظور شفاف وموثوق يسمح لنا بتنقية العاطفية والأيدلوجية؛ إن البيانات ستساعدنا 
على فعل أشياء رائعة - مثل التنبؤ بالمستقبل". إن من شأن مثل هذه الادعاءات المتعلقة 
بالبيانات أن تعزز كثيراً من الدعايات بشأن البيانات الكبيرة داخل مجتمع الأعمالء ويتم 
التعبير عنها بشكل عام من خلال الصياغة التجريبية - التي يمكن لها من خلال الحجم 
الكافي للبيانات أن تعبر البيانات عن نفسها. ومثل هذه الفلسفة التجريبية متضمنة بشكل 
à TRO‏ ادعاءات )2008( «Chris Anderson‏ وهو رئيس تحرير سابق à‏ مجلة وآیرد 
(Wired)‏ والذي ضربت دعوته التأليبية ob‏ البيانات الكبيرة ما هي إلا مؤشر على "انتهاء 
النظرية" على وتر حساس للكثير من المعلقين. لقد Anderson Sò‏ في مقطوعة استفزازية 
أن "طوفان البيانات يجعل ال منهج العلمي Sage‏ وأن الأنماط والعلاقات المتضمنة داخل 
البيانات الكبيرة تقدم بشكل متأصل معرفة مهمة وثاقبة عن العمليات eae ie I‏ 
والسياسية» والاقتصاديةء والظواهر المعقدة. وقد أكد ذلك قائلا: 
هناك الآن طريقة أفضل. فالبيتابايت تسمح لنا بأن نقول: "إن الارتباط كاف" 
(Correlation is enough)‏ ومكننا أن نتوقف عن البحث عن النماذج. ويمكتنا 
أيضا أن نحلل البيانات بدون أي افتراضات بشأن ما يمكن أن يظهره التحليل لنا. 
ويمكننا أن نرمي الأرقام في أكبر تجميعات الإحصاء التي شهدها العالم dogs‏ وأن 
ندع الخوارزميات الإحصائية تجد الأنماط إذا كان العلم لا يستطيع إيجاد هذه 
الأماط... فالارتباط يحل محل السببية» ويمكن للعلم أن يتقدم ويتطور حتى 
بدون النماذج المترابطة أو النظريات الموحدة, أو أي تفسير آلي على الإطلاق. لذ 
لا يوجد أي سبب للتعلق بالطرق القدهة. 
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وعلى نحو مشابه» أكد )2009( Prensky‏ على أنه "م يعد يتعين على العلماء الآن القيام 
بتخمينات تنم عن الثقافة, أو أن يقوموا بتأسيس افتراضات ونماذجء ويختبروا هذه الافتراضات 
وتلك النماذج مئ خلال التهازب uie Baazsd ditas‏ الساتات yas‏ من ذلك يمكنهم 
التنقيب في المجموعة الكاملة من البيانات بحثاً عن الأنماط التي تُظهر التأثيرات edis‏ 
النتائج العلمية بدون إجراء أي تجريب إضافي". ومن ثم فلقد أكدت )2012( Dyche‏ أن: 
"التنقيب في البيانات الكبيرة يكشف العلاقات والأنماط التي مم نكن نعرفها كي نبحث عنها". 
واستمرت في الادعاء قائلة: "هذه الأنماط محددة للغاية وتبدو وكأنه تم التحكم في تحديدها 
من خلال الافتراضات". وبالمثل أكد )2013( Steadman‏ على ما يلي: 


يتيح منهج البيانات الكبيرة تجاه جمع المعلومات المبني على ا معرفة للمحليين 
الحصول على القرار الكامل فيما يتعلق بالشئون idle‏ النطاق. فلا يتم فقد أي 
شيء عند النظر عن قرب بالغ إلى جزء واحد محدد من البيانات؛ ولا يتم فقد أي 
شيء عند محاولة الحصول على منظور واسع للغاية بشأن موقف حيث تم فقدان 


البيانات» ولا يجب على ال محلل أن يزعج نفسه حتى بطرح افتراض بعد الآن. لقد 

تحول دورها من دور استباقي إلى دور تفاعلي» حيث إن الخوارزميات هي من 

تقوم بالعمل السياقي... فالخوارزميات ستقوم بتحديد الأنماط ثم تقوم بوضع 

النظريات» ولذا فهناك حاجة متناقصة للقلق بشأن وضع افتراض في البداية ثم 

اختبار هذا الافتزاض من خلال غينة من البيانات: 

ويغبارة cmd]‏ فدلا من IT ed‏ ما كانت عض الأفاظ a sati‏ المعينة أو العلاقات 
co‏ د اقل deseos‏ بيائات: فان الغو E decas ann: E‏ الك من 
أجل اكتشاف ارتباطات ذات دلالة بين البيانات دون أن يتم توجيهها من قبل الافتراضات. 
وكما قال )2012:56( :Croll‏ "في النموذج القديم المتسم بندرة البيانات» كان يتعين علينا 
أن نقرر ما الذي ينبغي جمعه Yoj‏ ثم نقوم بجمعه. أما مع النموذج الجديد المتسم بوفرة 
البيانات» فنحن نقوم بالجمع أولاً ثم نسأل الأسئلة "oy‏ 
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إن الأمثلة المستخدمة ف توضيح مثل هذا الموقف عادة ما تكون نابعة من التسويق 
والتجزئة. فعلى سبيل JEL‏ وصف )2012( Dyche‏ حالة سلسة تجزئة حيث قام بتحليل 
صفقات الشراء لمدة اثني عشر عاما من أجل ملاحظة العلاقات المحتملة غير ا ملحوظة بين 
المنتجات التي انتهى بها الأمر في سلة المشتريات للمتسوقين. وقد أدى اكتشاف الارتباطات 
بين البنود اممعينة إلى تعيين الأماكن الملائمة للمنتج الجديد وإجراء بعض التعديلات على 
إدارة مساحة الأرفف مع زيادة تبلغ >١‏ في الإيرادات لكل حقيبة تسوق في الشهر التجريبي 
الأول. م تكن هناك أي افتراضات ob‏ المنتج (س) على سبيل JEL‏ غالبا ما يتم شراؤه مع 
المنتج (ص) والتي تم اختبارها فيما بعد. لقد تم بكل بساطة طرح بعض التساؤلات بشأن 
البيانات من أجل اكتشاف ماهية العلاقات ام موجودة التي م يكن من الممكن ملاحظتها في 
السابق. وبا مثل فإن نظام التوصيات في موقع أمازون يقدم اقتراحات بشأن منتجات أخرى 
من الممكن أن يكون المتسوق latga‏ بها دون معرفة أي شيء عن ثقافة أو تقاليد الكتب 
والقراءة لذلك المتسوقء فهذا النظام يحدد» ببساطة: أنماط الشراء عبر العملاءء وذلك من 
أجل تحديد ما إذا كان الشخص (س) يحب الكتاب (ص)» فمن المحتمل أنه سوف يحب 
الكتاب (ز) وذلك بالنظر إلى الأنماط الاستهلاكية له وللآخرين. 


ويزعم Dyche‏ أن هذا المنهج المفتوح للاکتشاف» بدلاً من أن يكون موجهاء asd‏ أكثر 
احتمالية لكشف الأنماط الضمنية غير المعروفة, وذلك فيما يتعلق بسلوكيات المستهلك 
والعلاقة بين المنتجات» وا مخاطر الماليةء والتي يمكن الاستفادة منها لاحقا. وفي حين أن 
من الممكن أن يكون من المفضل توضيح أي ارتباطات موجودة داخل البيانات وما السبب 
في كون هذه الارتباطات ذات دلالةء فإن مثل هذا التفسير يعد غير ضروري بشكل «eS‏ 
فالمهم هو معرفة أنه Jei‏ ذلك. ومن ثم فلقد ادعى )90 :2013( «Siegel‏ (هذا هو 
تأكيدي) فيما يتعلق بالتحليلات التنبئية: "نحن في العادة لا نعرف عن السببيةء ونحن في 
الغالب لا نهتم بذلك بالضرورة... إن الهدف يركز بشكل كبير على التنبؤ أكثر من تركيزه 
على فهم العام... إنه بحاجة إلى أن ينجح فحسب؛ إن التنبؤ يفوق التفسير". وكما ادعى 
Weinberger (2011: 33)‏ فيما يتعلق بهنش (Hunch)‏ وهو موقع شبكي يقوم بتقديم 
توصيات بناء على الإجابات عن الأسئلة التي يبدو أنها لا ترتبط ارتباطا وثيقا بالأمئلة 
الأصلية التي تم توجيهها: 
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إن التحليل لا يدعم النظرية وهو لا يقدم أي نظرية. لا توجد لدى موقع 
هنش (Hunch)‏ أي $3 ,8 م أن الناس or‏ على سبيل «JULI‏ يفضلون ارتداء 
صندل على الشاطئ والذين م يقوموا بنفح الهندباء (نبته بريه) في العام الماضيء 
رما يحبون هذه الأفلام الأربعة (التي تم اقتراحها لهم). فالموقع م يكن لديه أي 
افتراض» وم يكن لديه أي تخمين. كل ما كان لديه ارتباط إحصائي فحسب. 


إن بعض برامج تحليلات البيانات يتم بيعها من أجل هذا التصور بالضبطء فعلى 
سبيل «JUL‏ فإن البعض يدعي أن برنامج التنقيب عن البيانات والعرض البصري آياسداي 
«(Ayasdi)‏ لديه القدرة على اكتشاف الرؤى بشكل Ji‏ بغض النظر عن التعقيد ودون 
توجيه أي أسئلة. ويمكن لعملاء آياسداي أن اعرا الإجابات عن الأسئلة التي م 
يكونوا يعرفون أن يسألوها elàll à‏ الأول. ولعرض الأمر بصورة مبسطةء فان آياسداي هو 
«سرنديبية رقمية» بمعنى أن آياسداي لديه القدرة على اكتشاف الأشياء المفيدة مصادفة 
(من أسطورة أمراء سرنديب الثلاثة)(2013 (Clark‏ وعلاوة على ذلك فهناك من يدعي أن 
آياسداي أزال بشكل (JS‏ دور العنصر البشري في عملية التنقيب عن البيانات - ومن ثم 
فلقد أزال جميع التحيزات البشرية المتضمنة معه. وبدلاً من انتظار أن يتم توجيه سؤال 
eal‏ أو أن يتم توجيهه إلى روابط بيانات موجودة معينةء فإن النظام سوف يقوم وبدون 
توجيه باكتشاف الأنماط التي رها لم يفكر المتحكم البشري أن يبحث (Clark 2013) lie‏ 

إن هناك مجموعة قوية وجذابة من الأفكار التي تعمل في مثل هذه المجادلات والتي 
تجري على نحو متضاد مع المنهج الاستدلالي المسيطر وا مهيمن داخل العلوم الحديثة. أولا: 
أنه يمكن للبيانات الكبيرة أن تلتقط المجال بالكامل وأن تقدم كرارا كاملا LB‏ أنه لا توعد 
هناك حاجة للنظرية» أو النماذج» أو deu a cabal jay‏ كالما أنه من خلال تظبيق 
تحليلات البيانات بدون دراية يمكن للبيانات أن تتحدث عن نفسها وهي متحررة من 
الصياغة والانحياز البشريينء وأن أي أنماط أو علاقات داخل البيانات الكبيرة تكون صادقة 
وهادفة بشكل أصلي. رابعا: أن المعنى يتجاوز السياق أو ا معرفة المرتبطة با مجال. 


فهذه الأمور تعمل سوياً لي تشير إلى أن هناك أسلويًا جديدًا في العلوم يتم تأسيسه 
وهو الأسلوب الذي تكون فيه طريقة العمل استقرائية بطبيعتهاء وبمثل هذا ادعى 
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Gannon and Reid (2009)‏ أن "التوافر الجاهز في البيانات المتعددة يحول المناهج 
العلمية من الطريقة العلمية التقليدية التي تقودها الافتراضات إلى العلوم المعتمدة على 
الاستكشاف". وبامثل. يقترح )127 :2011( Weinberger‏ أن الهدف التقليدي للعلوم 
المتمثل في تكوين النظريات التي تدعمها الحقائق وتفسر الحقائق في الوقت ذاته يتحول 
في الوقت الراهن إلى "تقديم نماذج معقدة تفسر العلاقات المعقدة" حيث "في بعض 
dad]‏ يكوق a‏ اليل كتنف الت وا عمال رات م ول من «ilis‏ 
هناك ارتباط قوي ملاحظ بين المحاكاة والعالم الحقيقي والذي هنح الثقة ob‏ المحاكاة 
الأخرى سوف تقدم نتائج موثوقة". وقد ستخدم JULI Weinberger‏ المتعلق بوضع 
عمود على بعد متر واحد أمام أحد الأبواب في برنامج محاكاة لتدفق خروج الناس في حال 
الإخلاء والذي أدى إلى تدفق أفضلء ولكن دون وجود أي تفسير من النموذج للسبب الذي 
يجعل العمود يفعل ذلك. واقترح» بطرق أخرى متعددة: أننا لسنا بحاجة لأن نعرف السبب» 
وإنما نحتاج لأن نعرف أن العمود يفعل ذلك وأن تطبيق الفكرة سوف يساعد على إنقاذ 
حياة الناس» وقد أنتج هذا ل )26 :2013( Andrejevic‏ حالة تسمى "المعرفة بدون الفهم". 


مغالطات الفلسفة التجريبية :(The Fallacies of Empiricism)‏ 
لا يوجد هناك أي شك ob‏ البيانات الكبيرة لديهاء وسوف يكون لديها بشكل متزايدء 
تأثير على كيفية ممارسة وفهم العلوم. وعلى الرغم من EUS‏ فإن رؤية الفلسفة التجريبية 
بشأن كيفية تكون هذا العلم الجديد تعتمد على التفكير المغالط - جميع الأفكار الأربع 
التي تعزز تشكيلها مشكوك فيها. فلربما تكون هذه الأفكار جاذبة بشكل كبيرء ولكن 
التدقيق النقدي والفلسفي يكشف مشاكل خطيرة مع كل فرضية. إن من المهم أن يتم 
التحقق من كل $5« كل بدروهاء قبل صياغة رؤية بديلة للعلم الذي تقوده البيانات 

والذي eye‏ بين سمات الإبعاد. والاستقراء والاستنتاج. 

أولا: يمكن للبيانات الكبيرة أن تلتقط المجال بالكامل وأن تقدم قراراً كاملاً. حيث إن 
البيانات الكبيرة تكافح من أجل الشموليةء فمناصروها يدعون أنه من الممكن رؤية كل شيء 
داخل المجال (على سبيل JELI‏ جميع الأنشطة على موقع تويترء أو جميع عمليات الشراء داخل 
سلاسل املمتاجر الكبيرة)» وأنه من الممكن أن نفهم بشكل كامل ما نراه )2013 (Vis‏ وعلى 
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الرغم من US‏ وكما ناقشنا في الفصول Y‏ و" As‏ فإن البيانات الكبيرة رها تسعى إلى أن تكون 
شمولية» ولكنها تشكل SS‏ من التمثيل والعينة. فالواقع, أن جميع البيانات تقدم رؤى بصرية 
قليلة للعام» وليس رؤى شاملة: أي رؤى من وجهات نظر معينة باستخدام أدوات معينة, 
وذلك بدلاً من رؤى بصرية شاملة Y‏ تخطئ )2002 „(Haraway 1991; Amin and Thrift‏ 
وعلاوة على ذلكء فإن المجالات تتطور وتتغير, ومن ثم فإن البيانات الكبيرة ليس بإمكانها 
الوصول إلى كل مكانء وذلك يرجع من ناحية إلى أن البيانات الكبيرة لا يمكنها الإمام بجميع 
الأماكن والأزمنة. ومن ناحية أخرى؛ فإن الكثير من الأماكن والأزمنة الجديدة تبقى لكي يتم 
اختراعها )128 :2002 (Amin and Thrift‏ وعلى هذا النحوء تشكل البيانات الكبيرة "سلسلة 
من الأوامر الجزئية والكليات ا متمركزة. مع مقدرتها على التحديق في بعض الاتجاهات s»‏ عن 
الأخرى" Latour)‏ والمقتبس في 92 :2002 (Amin and Thrift‏ ومن ثم فلقد استنتج Vis)‏ 
3 "أنه من المهم أن نتذكر أن ما نراه تتم صياغته من قبل ما نحن قادرون على رؤيته أو 
في الواقع ما نريد رؤيته من خلال إطار عمل فكري محدد". 

ثانياً: أنه لا توجد هناك حاجة للنظريةء أو النماذج أو الافتراضات الاستنباطية. الافتراض 
هنا هو أن تكوين البيانات وتحليلات البيانات واللذان يعززان استخدام البيانات الكبيرة 
يبدو أنهما يأتيان من لا شيء» وأنهما بشكل ما متحرران من "القوة التنظيمية للفلسفة" 
(Berry 2011: 8)‏ فالأنظمة المتناقضة تصمم من أجل التقاط أنواع معينة من البيانات» 
وغالبا ما يحصل ذلك من أجل أغراض محددة للغاية» وأن التحليلات والخوارزميات اللتين 
تدعمان البيانات الكبيرة تعتمدان على الاستدلال العلمي وأنه تم صقلها من خلال الاختبار 
العلمي. فالعديد من الأفكار المستخدمة في تصميم نظم البيانات الكبيرة مستمدة من 
الأدبيات العلمية واسعة النطاق والتجارب والمعارف لهؤلاء الذين يعملون على النظام. 
إن هناك الكثير من الوقت ال مستنفد في اختيار واختبار طرق متعددة لتحديد واستخلاص 
القيمة من البيانات المنتجة» وتقييم النتائج وتطويع التحليلات. وهناك جدول أعمال 
يقود مثل هذا العمل وذلك فيما يتعلق ماهية النتائج المرجوة (زيادة دوران رأس امال أو 
الأرباح» أو فهم نظام معينء (E‏ والذي يستفيد من النظريات المبرهنة» وذلك فيما يتعلق 
بماهية الطرق الملحوظة لتحقيق مثل هذه التأثرات» وما ]15 كانت مثل هذه التأثيرات 
تحدث في الواقع ثم يتم اختبارها بعد ذلك. 
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وكما أشار )2012( Leonelli‏ فإن الإستراتيجية الاستقرائية لتحديد الأنماط داخل 
البيانات عادة ما يقودها الاستدلال العلميء وهي لا تحدث فراعًا علميًا. أو» كما ذكر 
Quintero (2012)‏ "لا مكن تقديم التفسيرات ببساطة من التحليلات الإحصائية» وذلك 
دون الحاجة إلى نظرية سابقة من نوع ما". وقد أتبع ذلك قائلاً: "كونك منقاداً بالبيانات 
يعد أمراً مفيداً فحسب إذا كان لديك نظرية قوية يمكنك من خلالها أن تستمر في طريقك, 
إن أي شيء 2l‏ سوف يتركك k‏ إلى منحدر دون أن تراه" . فالواقع» ys ol‏ من الاستدلال 
الاستنتاجي والاستقرائي يتم تشكيلهما Lað‏ بشكل استطرادي ولا Lii‏ أحدهما من لا 
شيء. ومن ثم فقد اقترح )1979( Popper‏ مقتبس من )74 :2012( Callebaut‏ أن 
جميع العلوم تطبق منهج الأضواء الكاشفة على الاكتشاف العلميء حيث يكون تركيز 
الي منقادا من خلال النتائج السابقة والنظريات والتدريب» وكذلك من خلال التخمين 
المؤسس على التجارب وال معارف. إن الأمر ذاته ينطبق على أمازون (Amazon)‏ وهنش 
(Hunch)‏ وآياسداي «(Ayasdi)‏ وجوجل .(Google)‏ فالكيفية التي اعتمد عليها أمازن 
في بناء نظام التوصيات على الاستدلال المنطقيء كانت مُعززة من خلال نموذج إرشادي 
يرافقه اختبار تجريبي تم تصميمه من أجل تحسين slol‏ الخوارزميات التي يستخدمها. 
وبالمثلء فإن جوجل يقوم ببحوث وتطوير واسع النطاق» وهو يعمل بالشراكة مع العلماء 
ويشتري المعرفة العلمية» سواء تم هذا من خلال تمويل البحوث داخل الجامعات أو من 
خلال شراء المعرفات الإلكترونية للشركات الأخرىء وذلك من أجل تنقية وتوسيع المنفعة 
بشأن كيفية تنظيمه» وتقدهه» واستخلاصه للقيمة من البيانات. ونتيجة «SJ‏ فإذا وجدت 
القواروات TE PRG‏ في البيانات» فإن ذلك يعود إلى أنه تم استخدام علم التعرف 
على الأماط جنباً إلى جنب مع المعرفة الخاصة بالمجال. 


ثالغا: يمكن للبيانات أن تتحدث عن نفسها وهي متحررة من الصياغة والانحياز البشريين 
إن ا مفهوم القائل بأن إنتاج ا معرفة من البيانات الكبيرة يحدث بشكل غير مرتبط بالعلم, 
هو على علاقة بالفكرة القائلة ob‏ تحليلات البيانات الكبيرة تمكن البيانات من التحدث عن 
نفسهاء وهي غير مثقلة بالسياقية أو أهواء التوضيح البشري. فليس فقط إنتاج البيانات 
هو ما يتم بشكل افتراضي ومتحرر من النظرية. فحتى تفسير ومعاني تلك البيانات يمكن 
بطريقة مشابهة أن يحدث في فراغ علمي» فمثل هذا ال مفهوم يعد سمة من سمات التفكير 
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التجريبي» وهو أنه عندما يتم تقديم وتحليل البيانات بطريقة ملانمة. فإن البيانات» بنفسها 
duis‏ تسيا فشكل :ولبلا ملحا وط رطا أو Todea 4 Due‏ من رها وفي حالة 
البيانات الكبيرة فإن حجم البيانات يضيف إلى أهمية الدليل. فهذا "التقديس" للبيانات 
يمكن أن يؤديء كما ادعى )2013( Jenkins‏ إلى حتمية البيانات في ا مناقشات التي تتم 
من أجل البيانات الكبيرة. وهذا يعني أن البيانات تتفوق على النظرية» وأن البيانات أمر 
حقيقيء في حين أن النظرية ليست حقيقية )2013 (Hales‏ وأن البيانات تقول الحقيقة في 
حين أن النظرية مجرد تلفيق. وهناء يوجد ثلاث قضايا يتعين التفكير فيها: القضية الأولى 
هي افتراض أن البيانات موضوعية» ومحايدة» ومتحررة من التحيز البشري. القضية الثانية 
أن الأنماط والعلاقات داخل البيانات الكبيرة هادفة وصادقة بشكل متأصل. القضية الثالثة 
أن تفسير مثل تلك الأنماط والعلاقات يفتقر إلى أي نوع من الوضعية والموقعية. 

وكما ناقشنا في الفصل الأولء فإن البيانات ليست ببساطة polis‏ محايدة أو طبيعية 
بحيث يتم فصلها عن العام بطرق محايدة وموضوعية» ويمكن قبولها بالقيمة الاسمية. 
فالبيانات لا توجد قبل تكوينها ولا تنشأ من أي شيء. ولكن الأحرىء أن البيانات يتم إنشاؤها 
داخل مجاميع البيانات المعقدة التي تشكل تركيبها بشكل فعالء ولا هكن للبيانات في هذه 
الحالة التحدث عن نفسهاء ولكنها على الدوام تتحدث» بشكل متأصلء من وضعية معينة 
(Crawford 2013)‏ وعلاوة على ذلك» فإن ادعاء )2008( ob Anderson‏ الارتباط يفوق 
السببية يشير إلى أن DEYI‏ الموجودة داخل مجموعة البيانات ذات معنى بشكل متأصل. 
وهذا افتراض يعرف جميع الإحصائيون المدربون أنه خطر وغير صحيح. فالارتباطات بين 
المتغيرات داخل مجموعة البيانات يمكن أن تكون عشوائية بطبيعتها ويوجد بينها ارتباط 
عرضي قليل» أو لا يوجد هذا الارتباط على الإطلاق (انظر الفصل التاسع). إن تفسير أي 
ارتباط على أنه ذو مغزى رها يؤدي في هذه الحالة إلى مغالطات بيئية خطيرة. ويمكن أن 
يتفاقم هذا الأمر في حالة البيانات الكبيرةء وذلك يرجع إلى كون الموقف التجريبي يظهر 
وكأنه يعزز ممارسة تجريف البيانات - البحث عن أي ارتباط - ومن ثم يزيد من احتمالية 
اكتشاف ارتباطات عشوائية. وعلى الرغم من ذلك» ففي حين أن التعرف على الأنماط 
رها يحدد علاقات شيقة محتملة: إلا أن صحة هذا الأمر تستلزم اختباره على مجموعات 
بيانات أخرى وذلك من أجل التأكد من مصداقيتها وصحتها. وبعبارة أخرىء يتعين أن 
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تشكل العلاقات أساس الافتراضات التي يتم اختبارها على نطاق أوسع» والتي تستخدم بعد 
ذلك من أجل بناء وصقل النظرية التي تفسرهاء ومن ثم فإن الارتباطات لا تفوق السببية 
ولكنها بالأحرى يجب أن تشكل أساس بحوث إضافية من أجل معرفة ما إذا كانت مثل 
هذه الارتباطات دالة على السببيةء وفي هذه الحالة فقط هكننا أن ندرك مدى مغزى أسباب 
الارتباط. 

às‏ حين أن الفكرة القائلة ob‏ البيانات تتحدث عن نفسها وهي متحررة من التحيزات 
أو أن الصياغة رها تبدو وكأنها فكرة جاذية» إلا أن الواقع مختلف إلى حد ما. فبحسب ما 
«Gould (1981: 166) jul‏ فإن "البيانات غير الحية لا بمكنها أبداً أن تتحدث عن نفسهاء 
ونحن lass‏ نحاول أن نوجه بعض إطار العمل المفاهيمي» سواء كان Sica Lo‏ بصورة 
ax‏ آم مركبًا بشكل محكم ومنهجيء نحو مهمة الاستقصاء والتحليل» والتفسير". إن 
فهم البيانات دوما مؤطر؛ ويتم فحصها من خلال منظور معين يصوغ كيف تتم ترجمتهاء 
وحتى لو كانت العملية مؤتمتة بطريقة ماء فإن الخوارزميات ا مستخدمة للعالجة البيانات 
عادة ما تكون متشبعة بقيم معينة وتكون مقترنة بالسياق داخل منهج علمي معين. 
وكما أوضح )2013( :Hales‏ فإن "أي اختبار إحصائي أو خوارزمية تعلم Ji‏ تعبر عن 
منظور ماهية النمط أو النظام.. . فأحد الخوارزميات سوف [PPS‏ ماء في حين تجد 
خوارزمية $52( DE‏ آخر" . فإذا ترجم ذاك شخص ماء فسيكون من المحتم أن يستفيد 
من معرفته» ومهاراته» وحدسه المتراكم من أجل تنقية رؤاه. حتى يقوم محلل مختلف 
Ss‏ فالفهم أو التفسير يتشكل في العادة من خلال 
أعين ا لمشاهدين بخ بغض النظر عن ادعائهم أنهم محايدون أو متحررون من القيمة الناتجة, 
agiles‏ على ذلك» فإن التفسيرات ليست ثابتة» فهي تتغير كلما تعرضت إلى معارف جديدة 
من خلال «soo‏ أو مناقشات» أو مجادلات إضافية. وعلى هذا فإن البيانات لا تتحدث 
عن نفسها dal‏ وكما ادعى )9 :2012( :Silver‏ "نحن نتحدث بالنيابة عن البيانات". 


«sul;‏ امعنى يتجاوز السياق أو المعرفة ا مرتبطة بالمجال. إن من الجوانب المرتبطة 
بالفكرة القائلة بأن البيانات تتحدث عن نفسها ا مفهومٍ القائل بأن تفسير البيانات الكبيرة 
لا يتطلب معرفة سياقية أو مرتبطة مجال معين. وبدلا من «US‏ فالمهم هو المقدرة على 
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توضيح ال معنى داخل البيانات» فبسبب أن البيانات من اممفترض أن تتحدث عن نفسهاء 
يمكن لأي شخص ذو فهم معقول بالإحصاء أن يكون PNE‏ على تفسيرها. إن هناك شكوكًا 
قليلة فيما يتعلق بأن علماء البيانات والحاسب والعلماء الآخرين يتحركون داخل نطاق 
تخصصات بعضهم البعض مع انتشار البنى التحتية للبيانات والحوسبة. وف الكثير من 
الحالات» فإنهم لا يقدمون أدوات جديدة فحسب. ولكنهم يشتركون بفعالية في تفسير 
البيانات. ومع ذلك» فإن هؤلاء العلماء لديهم القليل من الفهم ال معمق في المجال المناط بهم 
وكذلك بالنظريات التجريبية المتعمقة والمعارف التي تم تأسيسها عبر فترات زمنية طويلة. 
فعلى سبيل «JULI‏ فيما يتعلق بالعلوم الاجتماعية والإنسانيةء فإن الأساليب الجديدة من 
التحليلات والبنى التحتية للبيانات توجه من قبل علماء الحاسب والفيزياء. وفي الغالب 
تجعل النتائج أولئك المتشربين لوجهة النظر التخصصية يستسلمون وينقادون لهذه النتائج. 

ولتوضيح هذا الجانب» فإن المجال الناشئ للفيزياء الاجتماعيةء والذي من خلاله يقوم 
الفيزيائيون وآخرون باتخاذ قرارات بشأن العمليات الاجتماعية والمكانية slo‏ على تحليلات 
البيانات الكبيرة. وخاصة تلك المتعلقة بالمدن والقوانين المفترضة التي تعزز صياغتها 
ووظائفها )2013 (Bettencourt et al. 2007;Lehrer 2010; Lohr‏ غاليا ما يتجاهل 
عن عمد ثقافة ele‏ الاجتماع الممتد لقرنين من الزمان» ويشمل ذلك تجاهل التحليلات 
الكمية والنماذج TAR ATERA‏ من الزمان. والنتيجة هي تحليل المدن الذي يكون 
Lad‏ إل سد كن alors Lang‏ اترات التفاقة id dl‏ والحوكنة وراس Aib‏ 
وتقاليد ثرية من العمل الذي سعى نحو فهم كيفية عمل المدن من النواحي الاجتماعية, 
والثقافيةء والسياسيةء والاقتصادية والنتيجة إعادة إنتاج الأنواع ذاتها من أوجه القصور التي 
أوجدتها العلوم الاجتماعية الكمية / الوضعية في منتصف القرن العشرين (:2914 Kitchin‏ 
.(Mattern 2013‏ وهذا أيضا يتعدى حدود التقاليد المتنوعة والثرية للإرث الفلسفي 
ويعمل على تعزيز المناهج الفلسفية التجريبية والوضعية بصفتها أفضل وسيلة لفهم مدن 
مع أنه من ا محتمل ألا يتفق مع هذه الرؤية التظرية إلا القليل جذا من العلوم الاجتماعية 
التي تلت عصر الفلسفة الوضعية )2013 (Kitchin‏ 
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إن هناك مجموعة متشابهة من المخاوف لدى أولثك العاملين في مجال العلوم. 
فقد أشار )2012( Strasser‏ على سبيل JULI‏ إلى أنه في العلوم البيولوجيةء ادعى 
متخصص و المعلوماتية الحيوية الذين لديهم أسلوب معين وضيق للغاية لفهم علم 
الأحياء» أن الأرض كان يسكنها في السابق الأطباء السريريون وعلماء الأحياء التجريبيون 
والجزيئيون. وأشار إلى أن: "تحويل التحليل إلى البيانات الرقمية... يُفسح المجال أمام 
الأسئلة ا معرفية كتلك المتعلقة من هلك الشرعية ليكون منتجاً للمعرفة- المهتم بالآثار 
sl)‏ الطبيب السريري أو ble‏ البيولوجيا الجزيئية) أو الإحصائي الذي يحلل البيانات 
ويقدم المحاكاة أو النموذج (2012: 7). ومن ثم فإن بعض علماء البيانات بدون شك 
يتجاهلون ملاحظات )2013( «Porway‏ وهي: 


بدون توافر خبراء في موضوع البحث من أجل توضيح المشاكل مسبقاء فسوف 

نحصل على gili‏ ضعيفة... وبدون شك فإن هناك حاجة إلى خبراء في موضوع 

البحث من أجل تقييم نتائج العمل وخاصة عندما يتعامل الفرد مع بيانات حساسة 

عن السلوك البشري. وبوصفنا علماء بيانات» فنحن مؤهلون بشكل جيد للتعامل 

مع "ISL"‏ فيما يتعلق بالبيانات. ولكن لا يجب علينا إلا فيما ندر التعامل مع سؤال 

"اذا" فيما يتعلق با موضوعات التي لا نكون خبراء فيها. 

وكما أشار Porway‏ فإن المطلوب بالفعل هو أن يعمل علماء البيانات وخبراء 
النطاق مع بعضهم البعض من أجل التأكد من أن تحليلات البيانات ا مستخدمة مفهومة 
وأن النتائج من مثل هذه التحليلات يتم تفسيرها بعقلانية وسياقية. «Kills‏ يدعو 
Lazer et al. (2009: 10 - 11)‏ إلى التعاون بين elle.‏ الاجتماع الضالعين إحصائياً وبين 
غلماء a ita]‏ القالعين عاونا )10722009 01 وكا تاق aces‏ ادغ 
Minelli et al. (2013)‏ أن فرق علماء البيانات ينبغي أن يعملوا مع خبراء عمليات 
الأعمال من أجل الاستفادة من الرؤى المناسبة (انظر أيضًا الجدول 8-3( 


العلم المقاد بالبيانات :(Data-driven Science)‏ 
يسعى العلم المقاد بالبيانات» بدلا من كونه متجذراً في الفلسفة التجريبيةء إلى التمسك 
معتقدات الطريقة العلمية» ولكنه أكثر انفتاحاً لامتخدام مزيج مختلط من المناهج 
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الاستدلالية» والاستقرائيةء ae oz als‏ من أجل تطوير فهم الظاهرة. liag‏ يختلف عن 
التصميم الاستدلالي التجريبي التقليدي في أنه يسعى إلى طرح افتراضات ورؤى يتم توليدها 
من البيانات بدلا من توليدها من النظريات )613 :2009 .(Kelling et al.‏ وبعبارة 
أخرى. فهو يسعى إلى دمج أسلوب من الاستقراء في تصميم البحوث» وذلك على الرغم 
من أن الشرح من خلال الاستقراء ليس هو الغاية المستهدفة LS)‏ هي الحال مع المناهج 
الفجريية ). Vue‏ مق ةلق فيو يكل bala‏ عديدا من odo‏ قوليد القرضيات قبل 
استخدام esl‏ الاستنتاجي. ولا تنشاً عملية الاستقراء من لا شيء ولكنها تقع وتقترن 
بسياق نطاق نظري متطور للغاية. ومن ثم» فإن الإستراتيجية ال معرفية المتبناة داخل العلم 
atit‏ بالبيانات هي استخدام أساليب موجهة لاكتشاف المعرفة من أجل تحديد الأسئلة 
(الافتراضات) ال محتملة الجديرة باختبارات وبحوث إضافية. 


فالعملية يتم توجيهها من ناحية أن النظرية الحالية تستخدم من أجل توجيه عملية 
اكتشاف (i$ xL‏ وذلك بدلا من أن نأمل ببساطة أن نحدد جميع العلاقات داخل مجموعة 
البيانات وأن نفترض أنها ذات معنى بطريقة أو بأخرى. ومن ثم فإن كيفية تكوين 
البيانات أو إعادة تحديد الغرض منها تقوده افتراضات معينة تعززها خبرات ومعارف 
عملية ونظريةء مثل ما إذا كانت التقنيات وإعدادها سوف تلتقط أو تنتج مواد بحثية 
مفيدة وملائمة. فبدلا من إنتاج البيانات بأي وسيلة ممكنة. وذلك باستخدام أي نوع من 
التقنيات المتاحة أو أي نوع من أطر التمثيلء يتم التفكير بعناية في إستراتيجيات تكوين 
البيانات وإعادة توظيفهاء مع اتخاذ قرارات إستراتيجية من شأنها أن تؤدي إلى أنواع معينة 
من البيانات. وعلى نحو مشابه. يتم توجيه كيفية معالجة وإدارة وتحليل هذه البيانات 
من خلال الافتراضات المتعلقة بماهية الأساليب التي رها توفر رؤى هادفة. فالبيانات لا 
يمكن إخضاعها لأي صياغة وجودية ممكنةء ولا هكن إخضاعها كذلك لأي نوع من أساليب 
الق عن de abl‏ أمل هارما كه يعض الحفائق الشفية. Mass.‏ مو ذلك 
يتم اتخاذ القرارات المبنية على النظرية بشأن الطريقة الأمثل للتعامل مع مجموعة البيانات 
حتى يمكنها أن تكشف المعلومات التي رها تحمل فائدة محتملة وتكون جديرة ببحوث 
إضافية. وبدلاً من اختبار صحة أي علاقة يتم كشفهاء فإن الاهتمام يتركز على تلك العلاقات 
-بناءٌ على بعض soll‏ - التي يبدو أنها تؤدي إلى المسار الصحيح أو من ال محتمل بشكل 
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أكبر أن تؤدي إلى ا مسار الصحيح. وف الواقع» فإن الكثير من العلاقات المفترضة داخل 
مجموعات البيانات هكن تنحيتها على أنها تافهة أو سخيفة من قبل متخصصي المجالء في 
حين يتم وسم البعض الآخر على أنها تستحق اهتماماً إضافياً )2010 (HJJ. Miller‏ 

إن مثل عملية اتخاذ القرار هذه فيما يتعلق بطرق توليد البيانات والتحليل تعتمد على 
التفكير الاستدلالي. والاستدلال هو وسيلة للاستنتاج والتفكير المنطقي تم وضعه بواسطة 
Peirce (1839 - 1914) (H.J. Miller 0‏ .0.5). ويهدف الاستدلال إلى خاتمة تكون 
ذات معنى منطقي ومعقولء ولكنها ليست حاسمة في ادعاءاتها. فعلى سبيل JELI‏ لا 
توجد أي محاولة لاستنتاج ما هي أفضل طريقة لتوليد البيانات» ولكن يمكن بدلا من ذلك 
تحديد طريقة ذات معنى منطقي بالنظر إلى ما هو معروف بالفعل عن إنتاج مثل هذه 
البيانات. ويستخدم الاستدلال بشكل شائع في العلوم وخاصة في تشكيل الافتراضات» على 
الرغم من أن مثل هذا الاستخدام غير معترف به على نطاق واسع. ولذاء فإن أي علاقات 
يتم كشفها داخل البيانات لا تنشأ من لا شيء» ولا تتحدث عن نفسها ببساطة كذلك. إن 
عملية الاستقراء - للرؤى الناشئة من البيانات - تتم صياغتها بشكل سياقي. وهذه الرؤى 
ليست نهاية مطاف الاستقصاءء إذ يتم ترتيبها وتفسيرها من خلال نظرية ما. وبدلاً من 
ذلك» فإن الرؤى توفر الأساس لتشكيل الافتراضات والاختبار الاستنتاجي لصحتها. وبعبارة 
5,2« يعد العلم المقاد بالبيانات نسخة معاد تشكيلها من الطريقة العلمية التقليدية» مما 
يوفر وسيلة جديدة لبناء نظرية» وإضافة إلى ذلكء فإن التغيير المعرفي هو هادف بحد ذاته. 


ويدعي البعض أن العلم المقاد بالبيانات سوف يصبح النموذج الجديد للطريقة العلمية 
في عصر البيانات الكبيرة والمتدرجة OS‏ التفضيل المعرفي يتناسب مع استخلاص رؤى إضافية 
وقيمة سيفشل العلم التقليدي المقاد بالمعرفة في توليدها Kelling et al. 2009; H.J)‏ 
.(Miller 2012; Loikides 0‏ إن العلم المقاد با معرفةء عند استخدامه ga‏ استنتاجي 
مباشرء له فائدة معينة في فهم وتفسير العام تحت ظروف البيانات النادرة والحوسبة 
الضعيفة:. ولكن الاستمرار في استخدام مثل هذا النهج لا يبدو أنه مفهوم بشكل كاي 
عندما تشير التطورات التقنية وا منهجية إلى أنه من ال ممكن الاضطلاع بتحليلات أكثر ثراءً 
للبيانات - تطبيق تحليلات جديدة للبيانات وتوفر القدرة على ربط بيانات كبيرة ومتفاوتة 
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سوياً بطرق كانت غير ممكنة لوقت قريب» والتي تقدم بيانات جديدة قيمة - والتحديد 
والتعامل مع الأسئلة بطرق جديدة ومؤثرة. فالعلم المقاد بالبيانات» بحسب ما يتم نقاشهء 
يتناسب أكثر مع استكشاف واستخلاص القيمة وفهم مجموعات البيانات الهائلة والمترابطة, 
وتعزيز البحوث متعددة الاختصاصات التي تدمج خبرات المجال من خلال الإطار النظري 
الاستهلالي كونها أقل محدوديةء وسوف تؤدي إلى نماذج ونظريات أكثر شمولية وعمومية 
aco‏ اللعقدة Sas dal‏ من pole‏ منها )2009 (Kelling et al.‏ 


فعلى سبيل المثالء يدعي البعض أن العلم المقاد بالبيانات سوف يحول فهمنا عن 
الأنظمة البيئية )2009 (Bryant et al. 2008; Lehning et al.‏ وسوف يتيح إمكانية 
التكامل بين بيانات آنية ولحظية وعالية الدقة وذلك في سبيل تقديم نماذج تفصيلية للبيئة 
المتغيرة على النحو الذي يتعارض مع نقاط ثابتة غير متغيرة عبر المكان والزمان. ويقصد 
هنا التكامل بين البيانات التي يتم توليدها من العديد من المصادر كمحطات الطقس 
التقليدية واممتحركة» والأقمار الصناعية والتصوير الجويء ورادارات الطقس» ومحطات رصد 
التيارء ومحطات القياس» وملاحظات الممواطنينء والاستشعار الجوي واختبار جودة اطياه 
ومقاييس الغاز» وفحص «o JI‏ والحساسات الموزعة التي تقيس الظواهر المختارة مثل 
درجة الحرارة والرطوبة. ومن شأن ذلك التكامل أن يُسهم في تحديد العلاقات الخاصة 
بين الظواهر والعمليات التي تولد افتراضات ونظريات جديدة هكن اختبارها بعد ذلك 
من أجل التحقق من صحتها. وهذا سوف يساعد أيضًا على تحديد وفهم نقاط الربط 
بين مجالات بيئية مختلفة مثل الغلاف الجوي (الجو). والغلاف الحيوي (الأنظمة البيئية)» 
والغلاف GUI‏ (أنظمة المياه). والقشرة الأرضية (القشرة الصخرية للأرض)» والغلاف الترابي 
(التربة)» والمساعدة على دمج النظريات في مجاميع نظرية أكثر شمولية. ومن شأن هذا 
أن يوفر فهما أفضل للعمليات المترابطة والمتنوعة في أرض الواقع والعلاقات الترابطية بينها 
وبين الأنظمة البشريةء ويمكن استخدامه كذلك من أجل توجيه النماذج والمحاكاة من أجل 
التنبؤ بالاتجاهات طويلة المدى والإستراتيجيات التكيفية الممكنة. 
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العلوم الاجتماعية الحاسوبية والعلوم الإنسانية الرقمية 
:(Computational Social Sciences and Digital Humanities)‏ 

في حين أن معرفية العلم 3L RU‏ بالبيانات تبدو كما لو كانت وضعت لتحويل منهج 
البحث المطبق في العلوم امماديةء والطبيعية» والحياتيةء والهندسية» إلا أن مسارها في العلوم 
الاجتماعية والإنسانية يبدو أقل تأكيداً. فهذه المجالات من العلوم متنوعة بشكل كبير في 
أسسها الفلسفيةء وخاصة مع قيام عدد قليل فقط من العلماء في هذه المجالات بتوظيف 
المعرفة المشتركة بين العلوم. فهؤلاء الذين يستخدمون الطريقة العلمية من أجل تفسير 
ونمذجة الظواهر الاجتماعيةء بشكل cele‏ يستفيدون من أفكار الفلسفة الوضعية (على 
الرغم من أنهم رها لا يستخدمون مثل هذا العنوان» 2006 .(Kitchen‏ ومثل هذا العمل 
ميل إلى التركيز على ا معلومات الواقعية والكمية - الظواهر المشاهدة تجريبياً والتي هكن 
قياسها بشكل فعال كالأعداد والمسافات والتكلفة والوقت على النحو الذي يتعارض مع 
المجالات الأكثر مادية من الحياة الإنسانية مثل المعتقدات والأيدولوجيات - باستخدام 
الاختبار الإحصائي من أجل تأسيس علاقات سببية وبناء النظريات والنماذج التنبئية 
وا محاكات. فالمناهج الوضعية مؤسسة بشكل جيد في الاقتصاديات» والعلوم السياسية 
والجغرافيا البشريةء وعلم الاجتماع» ولكنها نادرة بشكل كبير في العلوم الإنسانية. وعلى 
الرغم من ذلكء فداخل هذه التخصصات المذكورة كانت هناك حركة قوية خلال النصف 
الأخير من القرن الماضي تجاه المناهج ما بعد الوضعيةء وخاصة في الجغرافيا البشرية وعلم 
الاجتماع. 

وفيما يتعلق بعلماء الوضعية في العلوم الاجتماعية. فإن البنى التحتية للبيانات» والبيانات 
المفتوحة والبيانات الكبيرة توفر فرصا هائلة من أجل تطوير نماذج أكثر تطورا وأكثر دقة وعلى 
نطاق واسع للحياة الإنسانية. فثورة البيانات توفر إمكانية الانتقال من دراسات ام مجتمعات 
التي تتسم بالندرة في البيانات إلى الدراسات الثرية في البيانات» ومن اللقطات الثابتة إلى 
الانتشار الديناميي» ومن التجميعات الرديئة إلى الدقة العاليةء ومن النماذج البسيطة نسبياً 
إلى محاكاة أكثر .(Kitchen 2013) ERT hia‏ إن هناك احتمالية لعصر حديد من 
العلوم الاجتماعية الحاسوبية التي تجري دراسات ذات اتساع» وعمق» assag‏ وإطار زمني 
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أكبر بكثيرء وهي تغطي فترات da)‏ متعددة بشكل متأصلء وذلك على النقيض من بحوث 
العلوم الاجتماعية الحالية )2012 (Lazer et al. 2009; Batty et al.‏ وعلاوة على «AS‏ 
فإن حجم» وصحة» 939 e‏ وشمولية» ودقة» وارتباطية» ومرونة»ء وتوسعية البيانات» بالإضافة 
إلى القوة المتزايدة للحوسبة وتحليلات البيانات الجديدةء تتعامل مع بعض انتقادات علماء 
الوضعية حتى اليوم» وخاصة تلك المتعلقة بالاختزالية والشموليةء وذلك من خلال تقديم 
تحليلات أكثر دقة وحساسية والتي يمكنها أن تهتم بالسياق والاحتمالية» ويمكن استخدامها 
من أجل صقل وتوسيع الفهم النظري للعام الاجتماعي المكاني. وعلاوة على ذلك» وبالنظر 
إلى شمولية البيانات» فمن الممكن اختبار صحة مثل هذه النظرية عبر العديد من المواقف 
والبينات. وفي Jia‏ هذه الظروفء فإن المعرفة عن الأفرادء وا مجتمعات» والجماعات, 
والبيئانت سوف تصبح $81 فضا E‏ وذلك فيما يتعلق بصياغة السياسة والتعامل مع 
القضايا المتعددة التي تواجه البشرية. إن التحدي الكامن في مثل هذا السيناريو b‏ يعد هو 
البيانات» ibd RSEN‏ طرق إحصائية ونمذجة جديدة لها المقدرة على التعامل مع ملايين 


الكثير دوا ا dit ass‏ اتان لاجقا والكثير 5 كان ه من ner n‏ 
إليها في السابق كملايين الكتب» واممستندات» والصحف. والصور, والأعمال الفنيةء والأشياء 
المادية... إلخ من عبر التاريخ والتي تم تحويلها إلى الصيغة الرقمية خلال العقدين السابقين 
من خلال مجموعة من المنظمات) )2008 (Cohen‏ وإتاحة أدوات جديدة لمعالجة وإدارة 
وتحليل البيانات؛ وتوفر وسائل جديدة لتعزيز التعاون بين مختلف التخصصات وتجاوز 
نموذج العام الواحد؛ وتوسعة الروابط البحثية مع المؤسسات غير الأكادمية وتضمين جمهور 
جديد على نطاق أوسع )2008 (Sword‏ وتخضع هذه الفرص للدراسة على نطاق واسع 
من خلال المجال الناخ للإثسانيات daa JI‏ والذي يجمع العلماء سوبا من جميع اللوم 
الإنسانية كا مؤرخينء واللغويينء والفنانين المبدعين» وعلماء الأدب والإعلام... إلخ مع أخصائي 
المكتبات» وعلماء الحاسبء والبيانات» والمعلومات. 
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التي تكونت في الأصل بشكل رقميء ورقمنة وأرشفة ال مشروعات التي تسعى إلى تحويل 
النصوص وال مواد التناظرية إلى صيغ رقمية بحيث يمكن تنظيمها والبحث فيها وإخضاعها 
لأشكال أساسية من التحليلات الآليةء والموجهة. والشاملةء مثل العروض الممرئية الموجزة 
للمحتوى أو الروابط بين ا مستندات. والناس أو الأماكن )2009 (Schnapp and Presner‏ 
ونتيجة لذلكء فلقد ادعى ال مؤيدون أن المجال قد تطور لكي يوفر أدوات أكثر تطوراً 
معالجة. وبحث. وربطء ومشاركة. وتحليل البيانات التي تسعى إلى إتمام ودعم طرق 
العلوم الإنسانية الحالية» وتسهيل الأشكال التقليدية من التفسير وبناء النظرية» وذلك بدلا 
من استبدال الطرق التقليدية أو تقديم منهج وضعي أو تجريبي لعلماء العلوم الإنسانية 
(Berry 2011; Manovich 2011)‏ 

إن ما توفره العلوم الإنسانية الرقمية هو وسيلة لمعالجة ومشاركة البيانات» وزيادة 
التحليل التقليدي» وتعزيز البحوث عبر مدى وحجم أكبر بكثير من المصادرء وتوفير الوقت 
والجهد. وبدلا من التركيز على حفنة من روايات العصر الفيكتوري أو صور من أوائل القرن 
العشرين أو اثنين من فناني عصر النهضة وآعمالهم» يصبح من ال ممكن البحث والربط عبر 
عدد كبير للغاية من الأعمال ذات الصلةء وبدلا من التركيز على حفنة من ال مواقع الشبكية 
أو غرف الدردشة أو الصور أو الفيديوهات أو الصحف الإلكترونيةء يصبح من ال ممكن دراسة 
الآلاف من مثل هذه الوسائط. ومن ثم فلقد ادعى )2011( Manovich‏ أن: "الدراسة 
dsl 3 Os lesa addo $5]‏ عاد نا كمف أفاظا si ae‏ 
التي لا هكن حتى من خلال القراءة المتأنية لأفضل دليل أن تكشفها". وبالطبع فإن جيشاً 
من علماء العلوم الإنسانية لن يكون قادراً بشكل حريص على القراءة المتأنية Cle aed,‏ 
بيانات هائلة في المقام الأول. وادعى )2005( Moretti‏ أن العلوم الإنسانية الرقمية ستطبق 
الصرامة المنهجية على التخصصات التي كانت في السابق غير نظامية وعشوائية في تركيزها 
ومنهجها المتبع. وادعى أن الأدبيات ذات الصلة بالأعداد. والأشكالء والوسائط المرئية من 
المحتمل أن توفر رؤى جديدة وتضفي Uis;‏ جديداً على المجالات ال منهكة. 
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s‏ الوقت «lS‏ وكما أن هناك فرصًاء هناك أيضًا مجموعة من التحديات. فبالنسبة 
للمعارضين» فإن استخدام طرق العلوم الإنسانية الرقمية الجديدة سوف تعزز ما أطلق 
عليه )2005( Moretti‏ مصطلح "القراءة عن بعد" حيث هكن لأجهزة الحاسب أن تعمل 
مثل آلات القراءة )2010 (Ramsay‏ فمثل هذا النهج يتعارض مع ال ممارسة الراسخة منذ 
أمد بعيد والمتعلقة بتوفير قراءة متأنية للمصدر. وقد ادعى )20 :2010( Culler‏ على 
سبيل المثال بأن: "ما يتعارض مع القراءة المتأنية ليس القراءة عن بُعد ولكن شيئاً ما مثل 
القراءة غير المتقنة أو القراءة العرضية". واستمر قائلاً بأن القراءة المتأنية تتضمن الاهتمام 
بكيفية إنتاج أو نقل اممعنى» وبنوع الإستراتيجيات والأساليب الأدبية والبلاغية ا مستخدمة 
من أجل تحقيق ما يمكن للقارئ أن يأخذ به على أنه المؤثر على العمل أو الفقرة (ص 
liag (Q2‏ شيء لا يمكن للقراءة عن بعد أن تقوم 4« فقلق Culler‏ ناتج عن أن العلوم 
الإنسانية الرقمية لا تسهل أو تعزز "القراءة عن بعد" فحسب» بل إنها تجعل "من الممكن 
إجراء البحوث الأدبية بدون القراءة على الإطلاق: مثل إيجاد كافة الحالات التي وردت فيها 
كلمتي "يتسول" و"متسول" في روايات كتبها اثنان من المؤلفين ثم كتابة النتائج" (ص 24). 

kas] بأن: "النموذج امقاد‎ Trumpener (2009: 164) نحو مشابه» ذكرت‎ (ies 
فإنه يحدد‎ «S لتاريخ الأدب... يبدو أنه يتطلب يدا مجهولة غير مرئية. وعلاوة على‎ 
هكن تحديدها من خلال تتبع محفوظات‎ Y الأماط ولكنه يتجنب تحديد السببية» والتي‎ 
الناشرين» وقراءة مسودات المخطوطات الفردية في مكتبات الكتب النادرة ومحاولة فهم‎ 
بتحديد عنوان كل رواية: ا مؤلف» الناشرء أو وكيل الدعاية" (ص‎ eB من كتاب لكتاب» من‎ 
وبالنسبة لهاء فإن مثل هذا البحث يتضمن حركة حقيقية وليس استخدام مجموعة‎ .4 
من الخوارزميات. كما أكدت أن تحليل آلاف النصوص يعني "أن أي نص معين سوف يصبح‎ 
غير ذي صلة من الناحية الإحصائية" (ص 164). واستمرت قائلة " أي محاولة لرؤية الصورة‎ 
بالكامل تحتاج إلى دعم من قبل ا معرفة الواسعة وفهم تأريخي فطن بكيفية عمل الأساليب‎ 
والمؤسسات الأدبية والأدوات التفسيرية القاطعة. وفي معرض تقديرها للجزافية ", اختتمت‎ 
قائلة إنه من "المهم أن معظمنا تخلى عن الاستمرار في البقاء في‎ (YVY - ١7١ كلامها (ص‎ 
المكتبة... فاليأس من عدم توافر المعرفة الشاملة يجب ألا يدفعنا إلى التفكير المتطرف‎ 
أن نبدأ في معالجة الأدبيات بكميات هائلة لكي نحرز أي تقدم".‎ Ue المعاكس بأنه يجب‎ 
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وبا مثل» فبالنسبة ل )2012( «Marche‏ فإن الآثار الثقافية مثل الأدبيات لا Sue‏ معاملتها 
كونها مجرد بيانات. فالجزئية الأدبية المكتوبة لا مكن أن تكون ببساطة مجرد ترتيب 
للحروف والكلمات» بل هي مقترنة بالسياق وتنقل ال معنى ولها سمات تفوق الوصف. 
فالخوارزميات ضعيفة للغاية فيما يتعلق بالتقاط وفك تشفير المعنى أو السياقء وكما 
ادعى Marche‏ فإن الخوازميات تعامل جميع الأدبيات كما لو كانت هي نفسها. واستمر 
قائلاً: "إن التحليل الخوارزمي للروايات والمقالات في الجرائد يكون بالضرورة ضمن حدود 
الاختزالية. إن عملية تحويل الأدب إلى بيانات تزيل التفوق «l5‏ وهي تزيل التذوق وتزيل 
جميع الدقة من النقد. وتزيل التاريخ المرتبط بإطلاق هذا «ssl‏ فرواية "إلى المنارة" ما 
هي إلى رواية أخرى من ضمن ركام الروايات". 

وعلاوة على ذلك» فبالنسبة للآخرين, فبدلاً من العمل على المصادر الأصليةء فإن العلوم 
الإنسانية الرقمية تتعامل مع الأشياء الرقميةء التي تنقل دفعة واحدة وتختلف من الناحية 
الكيفية عن أصولها (معنى أنها وصف للوصف) وذلك من شأنه أن يؤثر بشكل حتمي على 
تفسيرها. 

وبالنسبة للكثيرينء فإن العلوم الإنسانية الرقميةء في هذه الحالة. تعزز التحليلات 
السطحية الضعيفة بدلا من الرؤى العميقة المتخلخلة. ولذاء يتم نقدها على اختزاليتها 
المفرطة وعدم إتقان أساليبهاء وتضحيتها بالتعقيد. والتدقيق» والسياقء والعمق» ونقدها 
للأماط الوصفية. والآليةء والمدرجةء ds hls‏ والانطباع ob‏ التفسير لا يتطلب معرفة 
سياقية عميقة. ومن ثم» فلقد ادعى )2013( Jenkins‏ أن: "قيمة الفنون وجودة المسرحية 
أو الرسم لا يمكن قياسها على الإطلاق. فأنت مقدورك وضع جميع أنواع البيانات في آلة: 
«às‏ والألوان» والصورء وإيصالات شباك التذاكر» ولكن لا يمكن GY‏ منهم أن يفسر ما 
هو العمل الفني» وما الذي يعنيه. وما السبب في قوته» فالإجابة عن هذه الأسئلة تتطلب 
إنساناً وليس آلة. وفي حين أنني متأكد أن البيانات الكبيرة مفيدة, إلا أنها لا تنطبق على 
جميع مجالات الحياة البشرية» فهي لن تحسن الظروف البشرية. فالحب. والثقافة. والفنء 
والسياسة أمور ضرورية في حياتنا ولكن البيانات الكبيرة تخبرنا القليل عن هذه الأمور. 
وباختصارء لا تصدق جميع الدعايات عن البيانات» فهي ليست الإجابة عن الأسئلة الكبيرة". 
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وعلاوة على ذلكء فإن التمويل المحدود المخصص للعلوم الإنسانية تتم إعادة تركيزه 
على مشروعات العلوم الإنسانية الرقمية وذلك على حساب الدراسات الأكثر تقليدية مما 
يحرم بعض تخصصات العلم من التمويل. وتسري تأثيرات عمليات إعادة توزيع التمويل 
La‏ داخل العلوم الإنسانية الرقمية ذاتها حيث غالباً ما يتم توجيه التمويل تجاه بناء 
البنى التحتية للبيانات وإنشاء أدوات جديدة: وذلك بدلا من تمويل مشروعات تستفيد من 
المجموعات الرقمية من أجل الإجابة على الأسئلة الأكثر جوهرية. والنتيجة توجيه التمويل 
تجاه هندسة البرمجيات» وتطوير أدوات تحليلية» ومعدات» ومختبرات» ومشروعات اموارد 
الأخرىء وذلك Jus‏ من تمويل العلوم الإنسانية بذاتها. 


ويمكن أن تنطبق ذات أنواع المناقشات هذه فيما يتعلق بالعلوم الاجتماعية الحاسوبية. 
فعلى سبيل ال مثالء في مناقشة تتعلق بتأليف التصوير في ويكيبيدياء ادعت فيرناندا فيجاس 
(Frenanda B. Viegas)‏ والتي تعمل في مختبر الاتصالات المرئية في (IBM)‏ أن التخطيط 
المرئي للبيانات هكن أن "يساعد الباحثين على تحديد الأسئلة التي رها مكن استكشافها 
من الناحية الإحصائية - على سبيل «JUL‏ ما مدى تكرار حدوث التخريب» وما مدى سرعة 
ارتداد النص؟" (مقتبس في 11 :2010 (Bollier‏ وعلى e£ JI‏ من ذلك» تعد مثل هذه 
الأشكلة سيظة Jead‏ ففي هذه الحالةء رها يكشف التخطيط المرثئي أن موضوعاً ما تتم 
مناقشته بحماسة بالغة وال مدى الذي يمكن أن يجعل محرري ويكبيديا يتدخلون في عملية 
تحرير مدخلات البيانات» ولكن التخطيط المرثي يفعل القليل للإجابة على الأسئلة الأكثر 
نفعاً وتشويقاً وكشفا مثل أسباب وطبيعة النزاعات والقصص البديلة التي يتم إنتاجها 
ولا تتم دراسة أي منها بشكل أمثل من خلال الإحصائيات. وعلى نحو مشابهء فإن خريطة 
لغة التغريدات فى مدينة ما رها تكشف أنماط التركيز الجغرافي لجماعات عرقية متعددة 
ولكن الأسئلة المهمة هي من يشكل مثل هذه التركيزات» وما السبب في وجودهاء وما هي 
العمليات التي أسهمت في التشكيل والتكاثرء وما هي نتائجها الاجتماعية والاقتصادية. إن 
تحديد الأنماط شيء؛ ولكن تفسير هذه الأنماط شيء مختلف تماماء حيث يتطلب نظرية 
اجتماعية ومعرفة سياقية عميقة. وفي Jio‏ هذه الحالات» فإن الخطر يكمن في أن البحوث 
تمارس ببساطة بسبب توافر البيانات» مما يحد بشكل كبير من الأسئلة التي يمكن توجيهها 
وذلك لأن البيانات م يتم إنتاجها مع وجود مثل هذه الأسئلة على البال )2013 (Vis‏ وكما 
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ادعى )2013( :Gonzalez Bailom‏ "إن تخطيط التوزيع ا مكاني للمشاعر الإيجابية, أو 
التكرار الذي يتم من خلاله ذكر بعض الكلمات في التواصل على الإنترنت لا يخبرنا الكثير عن 
توافق هذه الأنماط مع الديناميكيات الاجتماعية التي تشكلها وتخلقها... إن قياس الأشياء 
بسبب أنه يمكن قياسها فحسب» لا يجعلها مشوقة أو ذات صلة". 

وف حالات مثل خريطة التغريدات» فإن الأنماط المكتشفة hob‏ ما يتعين أن تكون نقطة 
النهاية وهو ما يبدو عليه الحال في بعض المشروعات )2013 (Rogers‏ والأحرى أن تمثل 
JL‏ الكمفقة تفظة ola JI‏ مما نطب بالتاكين Mad‏ أشرف من CAI‏ ورها عض 
مجموعات البيانات الأخرى. 


وكما هو الحال مع الانتقادات الأولى للعلوم الاجتماعية الوضعية ds SUI‏ فإن العلوم 
الاجتماعية الحاسوبية يُزج بها في مهام من قبل ما بعد الوضعيين كونها آلية» ومفتتة 
ومحددةء وتقلص الأفراد المتنوعين» والبنى الاجتماعية المعقدة متعددة الأبعاد. إلى مجرد 
نقاط بيانات Wyly)‏ منشور في الصحافة). وعلاوة على ذلك فإن التحليل يفسد من 
قبل افتراضات الحتمية الاجتماعية كما أوضح )2012( Pentland‏ ذلك بالأمثلة قائلا: "إن 
نوعية الشخص الذي تكون عليه تتحدد بشكل كبير من قبل بيئتك الاجتماعية» ولذا إذا 
كان بإمكاني رؤية بعض سلوكياتك, فيمكنني أن أستنتج الباقيء وذلك فحسب من خلال 
مقارنتك مع الأشخاص في جماعتك". وعلى النقيض من ذلكء يدعي البعض أن ال مجتمعات 
البشرية معقدة للغاية وفوضوية وغير متوقعة لكي يتم تحويلها إلى صيغ وقوانين» حيث 
توفر النماذج الكمية رؤى قليلة لتفسير الظواهر مثل الحروب» والإبادة الجماعيةء والعنف 
الأسريء والعنصرية. وعلى الرغم من أن البيانات الكمية يمكنها أن توضح بعض هذه 
المجالات» فإنها توفر رؤى شاملة فحسب للأنظمة البشرية الأخرى مثل الاقتصاد. وهي 
تفسر بشكل غير كاف دور السياسة. والأيدلوجياء والبنى الاجتماعية, والثقافة Harvey)‏ 
1972(. إن الناس لا يتصرفون بطرق منطقية ومحددة dà i‏ ولكن بدلا من ذلك فهم 
يعيشون حياة مليئة بالتناقضات» والمفارقات» والحوادث غير ال متوقعة» فالكيفية التي يتم 
من خلالها تنظيم وعمل ال مجتمعات تختلف عبر الزمان Oly‏ ولا يوجد شكل مثالي أو 
أفضل أو سمات عاممية. وق الواقع» يوجد تنوع مدهش في الأفراد. والثقافات» وأساليب 
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الحياة على الكوكب. فتقليص مثل هذا التعقيد إلى الموضوعات المجردة التي تشغل النماذج 
العاممية يؤدي إلى الكثير من العنف الرمزي فيما يتعلق بخلقنا للمعرفة. وعلاوة على EUS‏ 
فإن المناهج الوضعية تتجاهل عن عمد المجالات الميتافزيقية (ما وراء الطبيعة) للحياة 
البشرية (المتعلقة باممعاني» وام معتقدات» والخبرات) والأسئلة المعيارية (المعضلات الأخلاقية 
والمعنوية بشأن كيف تكون الأشياء على النحو الذي يجب أن تكون عليه مقارنة بالوضع 
الحالي لهذه الأشياء) )2006 (Kitchen‏ وبعبارة أخرىء فإن المناهج الوضعية تركز فقط 
على أنواع معينة من dli I‏ والتي تسعى إلى الإجابة عنها بطريقة اختزالية تتجاهل على 
ما يبدو ما الذي يعنيه أن يكون المرء إنساناً وأن يعيش في مجتمعات وأماكن خصبة التنوع. 
وهذا لا يعني أن المناهج الكمية غير مفيدة بل هي مفيدة بشكل واضح للغايةء وخاصة 
فيما يتعلق بتفسير ونمذجة الأنظمة الآلية ولكن ينبغي فهم جوانب قصورها فيما يتعلق 
بفهم الحياة البشرية ودمجها مع المناهج الأخرى. 

ومن ثم فلقد ادعى Brooks (2013b)‏ أن تحليلات البيانات الضخمة تتصارع مع 
الطبيعة الاجتماعية كون الناس غير منطقيين ولا يتصرفون بشكل متوقع وكون الأنظمة 
البشرية معقدة بشكل غير معقول ولديها علاقات متناقضة ومتباينة. وهي تتصارع 
كذلك مع السياق كون البيانات منفصلة بشكل كبير عن السياق الاجتماعي» والاقتصاديء 
والسياميء والتاريخي» وهي أيضًا تخلق أكواماً هائلة من القش كونها تتكون من ارتباطات 
غير طبيعية هائلة للغاية مما يجعل من الصعوبة بمكان تحديد مكان الإبرة أو ما نبحث عنه 
وكونها تواجه مشاكل عند مجابهة المشاكل الكبيرة فغاضة ا مشاكل الاقتصادية والاجتماعية. 
وهي كذلك تفضل المستنسخ على الأصل كونها تحدد الاتجاهات ولكنها لا تحدد بالضرورة 
السمات المهمة التي رها تتحول إلى اتجاه وكونها تحجب القيم والمصالح المتعلقة منتجي 
البيانات وهؤلاء الذي يحللون البيانات وأهدافهم. 

وهم يفعلون ذلك لأنه وكما قال )174 :1981( Peter Could‏ وهو مؤيد للمناهج 
الإحصائية في تحليل البيانات: "يبدو أن رموز لغاتنا الرياضية مقيدة ومحددة بشكل كبير. 
وفي الغالب هم يحدثون أضراراً ليس لأنهم يقيدوننا فحسبء ولكنهم في الواقع يمحون من 
الوجود ما يمكن أن يكون مستحقاً لانتباهنا واهتمامنا. وإذا ما تصورناء وهذا ما نفعله في 


ثورة البيانات البيانات الكبيرة» والبيانات المفتوحة, والبنى التحتية للبيانات» والنتائج المترتبة عنها Yeg‏ 


الفصل الثامن 


الغالب» الطبيعة متعددة الأبعاد التي تصف تعقيد حياتنا المعاصرة... والفراغات الناتجة 
بواسطة الفلتر الخطي (Strainer Called)‏ المسمى تحليل العامل «Factor Analysis)‏ 
le Le à‏ بسحق المعلومات خارج الوجود وذلك تحت مسمىٍ التبسيط. إنني لست 
متأكداً تماماً من السبب وراء فعل «US‏ عدا أن لدي [S lied‏ قرا ob‏ توافر أجهزة 
حاسوب كبيرة وسريعة» وكذلك البرامج الجاهزة له يد في ذلك". 


وبالنسبة ل «Gould‏ فإن فهم السلوك البشري والمجتمعات البشرية لا يمكن ولا يجب 
تحويله إلى تحليلات متكررة ومنهجية وآلية» ولقد دعا إلى التفكير المستدام بشأن أنواع 
الأساليب التي يتعين استخدامها مع أي نوع من البيانات» وتحت أي ظروفء وذلك من 


أجل الإجابة عن بعض الأسئلة املحددة, بدلا من تشغيل البيانات من خلال guas‏ "نقانق" 
إحصائي والذي ينتج TN‏ منخفضة الجودة من الألف إلى الياء ya‏ من تقطيع اللحوم 
المنتقاة. 


وفيما يتجاوز الأملوب المنهجي OB «dons‏ جزءاً من القضية هو أنه يبدو أن بعض 
تحليلات البيانات الكبيرة تحدث دون وجود أي أسئلة على البالء أو أن يكون التركيز 
مدفوعاً من قبل تطبيق طريقة أو محتوى للجموعة البيانات بدلاً من سؤال محدد. أو أن 
تكون مجموعة البيانات مستخدمة من أجل البحث عن إجابات عن أسئلة م يتم تصميمها 
لكي يتم الإجابة عنها في امقام الأول. وفيما يتعلق بالأخيرء م يتم إنتاج بيانات jugi‏ ذات 
الان sas‏ ركا من أجل تقديم إجابات تتعلق بالتركيز الجغرافي لمجموعات اللغة في 
مدينة ما والعمليات التي تقود مثل هذا الارتباط الآلي d‏ فتمن يجب Ule‏ ألا تشهر 
بالدهشة رها في حالة ما إذا كانت النتيجة لقطات سطحية فحسبء حتى وإن كانت لقطة 
رائعة بدلا من ذلك فإن ما يجب أن يدهشنا هو الرؤى المتعمقة والمتغلغلة في جغرافيات 
الجنس. واللغةء والتكتلات» والانعزال في أماكن معينةء ولهذه الأسباب. ستظل دراسات 
البيانات الصغيرة مفيدة. 

وفي معرض الدفاع عن المنهج المستخدم من قبل العلوم الإنسانية الرقميةء ادعى 
Manovich (2011)‏ أن الهدف ليس استبدال الخبراء البشريين بأجهزة الحاسبء ولكن 
الهدف هو استخدام التحليلات من أجل استكشاف مجموعات البيانات الهائلة مثل بلايين 
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التغريدات, أو ملايين الفيديوهات على موقع يوتيوب» أو عشرات الآلاف من الروايات ومن 
ثم اختيار أهداف تمثيلية معينة من أجل التحليل اليدوي المحكم. وبعبارة أخرى فإن 
منهج العلوم الإنسانية الرقمية يفتح أمامنا إمكانية إجراء الدراسات السطحية على نطاق 
واسع عبر الأشخاص بدلا من الدراسات المتعمقة التي تركز على أعداد قليلة من الأفراد 
.(Manovixh 2011)‏ وبا مشل» يدعي البعض أن هذ المنهج يوفر العمل الدؤوب للتعمق 
في آلاف صفحات الأخبار ومشاهدة مئات الساعات من البرمجة» لكي "يتمكن الباحثين 
من تركيز طاقاتهم بشكل فعلي على التفسير" )2012 «(Harris‏ ولذا اقترح Flaounas et‏ 
(al. (2013: 1‏ أن: " أتمتة الكثير من المهام في تحليل ال محتوى الإخباري لن يحل محل 
الحكم البشري المطلوب من أجل آشكال التحليل النوعية والدقيقةء ولكنه سوف يسمح 
للباحثين بتركيز اهتمامهم على مدى أبعد بكثير من أحجام عينة الأشكال التقليدية من 
تحليل المحتوى. وبدلاً من قضاء الكثير من العمل الثمين على مرحلة ترميز البيانات eld‏ 
يمكن للمحليين التركيز على تصميم التجارب والمقارنات من أجل اختبار فرضياتهم» وأن 
يتركوا لأجهزة الحاسب مهمة اكتشاف جميع المقالات في موضوع «use‏ وقياس العديد من 
سمات المحتوى مثل قابليتهم للقراءة» واستخدام أشكال duse‏ من اللغة والمصادر إلخ. 
مجرد عدد قليل من المهام التي يمكن أتمتتها في الوقت الراهن 

وبا مثلء فلقد ادعى )2012( Selisker‏ أن العلوم الإنسانية الرقمية Y‏ تسعى إلى "أن 
تستبدل الأدب برموز الحاسب» أو أن تقايض التعقيد الأدبي بصيغ لا هدف لها. Maps‏ من 
«US‏ فإن هذه المشروعات تفكر فحسب بطرق إبداعية عن المشاكل التاريخية الأدبية التي لا 
Sce‏ التعامل معها بسهولة بدون الحواسيب". وبالنسبة ل )2010 ;2003( «Ramsay‏ هكن 
أن تساعد الحوسبة في عملية التفسير» ولقد ادعى أن القراءة المتأنية تتضمن ممارسات اختيار 
وعزل وملاحظة الأفاط à‏ النصوصء وأن الترميز ذو كفاءة عالية في مثل هذه الممارسات» 
وعلاوة على US‏ فإن الترميز يقوم بالأمر نفسه بطرق أكثر موضوعية واتساقاً من النظرة 
الذاتية klel‏ ودلا من ادال hel‏ الي dcos T E‏ الخزارزميات 
يسهل هذه العملية. 
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إن دفاع العلوم الاجتماعية الحاسوبية أمر مختلف تماماً في الغالب» ففي حين أن جميع 
العلوم الإنسانية الرقمية تقر بقيمة القراءة المتأنية» وتؤكد أن القراءة عن بعد تكملها 
من خلال توفير التعمق والسياقية» فإن الأساليب الموضوعية للعلوم الاجتماعية تتعارض 
مع المناهج بعد الوضعية. إن الفرق بين العلوم الاجتماعية الحاسوبية والعلوم الإنسانية 
الرقمية بهذا الصدد يرجع إلى أن الإحصائيات المستخدمة في العلوم الإنسانية الرقمية 
وصفية بشكل كبير تحدد الأنماط وتصوغهم كأعداد وصور وخرائط. وعلى النقيض من 
«eU‏ فإن العلوم الاجتماعية الحاسوبية تستخدم المنهج العلمي حيث تكمل الإحصائيات 
الوصفية بالإحصائيات الاستدلالية التي تسعى إلى تحديد السببية. وبعبارة أخرى. فإنها 
تحصل على الدعم من قبل ا معرفة حيث يكون الهدف هو تقديم نماذج إحصائية متطورة 
تفسر وتحاكي Loss‏ بالحياة البشرية. ومن الصعوبة بمكان التوفيق بين هذا وبين مناهج 
ما بعد الوضعية, فالدفاع في هذه الحالة يرتكز على فائدة وقيمة الطريقة واممناهج» وليس 
فان 1353 تحليل تكميلى لمجموعة هن البيانات أكثز Joa‏ 

وهناك بدائل ممثل هذا الموقف. مثل البديل الذي تم تبنيه في نظم المعلومات الجغرافية 
(GIS)‏ والإحصائيات الجذرية (Radical Statistics)‏ وهؤلاء الذين يستخدمون مناهج 
ذات طرق مختلطة. وهذا يتضمن إما توظيف النماذج والإحصائيات الاستدلالية شريطة 
أن يكون هنالك إدراك لمواطن الضعف فيهماء أو كما يحدث على نحو شائح» استخدام 
الإحصائيات الوصفية التي تدعمها دراسات البيانات الصغيرة. وهناء يتم استخدام كل من 
البيانات الكبيرة والبيانات الصغيرة من أجل توفير رؤى مختلفة ولكن تكميلية. وبغض 
النظر عن مثل هذه التكميلية: فإن الكثير من علماء ما بعد الوضعية سوف يستمرون في 
مقاومة البيانات الكبيرة والمناهج الإحصائية بأشكالها المتعددةء وبلا شك فإن المجادلات 
سوف تتسارع وتيرتها في المستقبل المنظور. 
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الخاتمة: 

هناك شكوك قليلة ob‏ ثورة البيانات أتاحت احتمالية إعادة التشكيل à sl‏ للعلوم, 
والعلوم الاجتماعية والإنسانية» وأن مثل إعادة التشكيل هذه تحدث بالفعل بشكل فعال 
ونشط. فالبيانات الكبيرة وتوسع البيانات الصغيرة من خلال البنى التحتية للبيانات يساعدان 
على تنفيذ مناهج جديدة تجاه إنتاج وتحليل البيانات» مما يجعل من الممكن توجيه الأسئلة 
والإجابة عنها بطرق جديدة. وقد شجع هذا البعض على الادعاء بشكل جريء بأن ثورة 
البيانات هي ابتكار تدميري يعلن عن نقلة نوعية في كيفية إجراء 52« وهذه بالقطع 
هي الحالة حيث إن التحول من صحاري البيانات إلى طوفان البيانات وتحليلات البيانات 
الجديدة سيغير الممارسات البحثية. وعلى الرغم من ذلكء يتعين أخذ الحيطة عند القيام 


إن العلم also‏ بشكل سين من قبل الادعاءات القائلة ob‏ ثورة البيانات تعني "أن 
البيانات يمكنها أن تتحدث عن نفسه" أو أنه يمكنها بدون أي مشاكل استخدام cdta‏ 
مثل تجريف البيانات حيث يسبق الارتباط السببية, (انظر الفصل التاسع). وتعد المناهج 
التي يتم تطويرها داخل العلوم المقادة بالبيانات والتي تمزج بين الاستدلالء والاستنتاج 
والاستقراء أكثر إنتاجية بكثين حيث تتم إعادة تشكيل الطريقة العلميةء وذلك بدلا من 
تدميرهاء إن الأسس الفلسفية للعلم المقاد بالبيانات» على الرغم من ذلك» لا تزال في أطوارها 
التمهيدية وهناك حاجة للتفكير المستفيض في معتقداتها ال معرفية ومبادثها ومنهجيتها. 

أما الموقف فيما يتعلق بالعلوم الاجتماعية والعلوم الإنسانية فهو أكثر تعقيداً بشكل ما 
وذلك إذا وضعنا في الاعتبار تنوع الأسس الفلسفية لهذه العلوم» حيث إنه من غير ا محتمل 
أن تقود ثورة البيانات إلى تأسيس نموذج جديد. وبدلا من «US‏ فإن البنى التحتية للبيانات 
وثورة البيانات سوف يعززان مجموعة البيانات المتوافرة للتحليل ويمكنان مناهج وأساليب 
جديدة. ولكنها لن تحل محل دراسات البيانات الصغيرة. وفيما يتعلق بالعلوم» هناك 
حاجة لتفكير نقدي أوسع في الآثار المعرفية لثورة البيانات على العلوم الاجتماعية والعلوم 
الإنسانية. وهذه المهمة بدأ بالكاد التعامل معها وذلك على الرغم من سرعة التغيير الحاصل 
في مشهد البيانات. 
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الفصل التاسع 
القضايا الفنية والتنظيمية 


(Technical and Organizational Issues) 


كما ناقشنا ف الفصلين السابقينء توفر البنى التحتية للبيانات ومبادرات البيانات 
المفتوحة وإنتاج البيانات الكبيرة فرصا جديدة لقياس وفهم العالم. وهي أيضًا تثير قضايا 
فنية وتنظيميةء وتطرح أسئلة معيارية وأخلاقية. وف هذا الفصلء سيتم التركيز على الأمر 
الأول Le‏ يعني التركيز على بعض القضايا مثل مجال مجموعات البيانات» والوصول إلى 
البيانات» وجودة البيانات» وتكامل البيانات» والتبادلية (القابلية للتبادل)» وتطبيق التحليلات 
والمغالطات البيئيةء والمهارات والقدرات والإمكانات التنظيمية. فبعض هذه القضايا هكن 
التعامل معها من خلال الحلول الإدارية والفنية» في حين أن البعض الآخر من هذه القضايا 
تمثل مشاكل عسيرة الحل ومن الصعب التعامل معها. وعلى الرغم من ذلك فإذا كانت 
القضايا المتعلقة بجودة البيانات والمغالطات البيئية لا Sue‏ التعامل معها بشكل «lS‏ 
ففي هذه الحالة لا يهم ماهية النظريات المعرفية التي يتم تطبيقهاء (انظر الفصل الثامن), 
oS‏ التحليلات والتفسيرات ستكون محل ارتياب. وعلاوة على US‏ فإذا كان الوصول إلى 
البيانات مقيداً بشكل كبيرء أو إذا كانت الحكومات والشركات والمجتمع المدني يفتقرون 
المهارات الكافية لإدراك المغزى من هذه البيانات» ففي هذه الحالة ستكون قيمة ومنافع 
البيانات المفتوحة والكبيرة المتدرجة مقيدة بشكل كبير للغاية. ونتيجة لذلك» فإن القضايا 
التي تمت مناقشتها في هذا الفصل لا هكن تجاهلها أو إبعادها بسهولةء ومن ثم فهي 
تتطلب الاهتمام البالغ. وف الفصل التاليء سيتحول التركيز إلى قضايا سياسية واجتماعية 
أعم وأشمل والتي تتعلق بإنشاء ومشاركة وتحليل واستخدام البيانات مع الوضع في الاعتبار 
الأبعاد الأخلاقية, والقانونية» والأمنية لثورة البيانات. 
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الصحاري والفيضانات :(Deserts and Deluges)‏ 
في كافة النقاشات الدائرة بشأن ثورة البيانات يكون في الغالب من الصعب تحديد مصدر 
مجموعة مناسبة من البيانات فيما يتعلق بالكثير من الظواهرء وبخاصة تلك البيانات التي 
تغطي فترات زمنية طويلة ومتأصلة مكانياً. وبشكل OB «e‏ هذه تعد قضية من قضايا 
التغطية من ناحيةء ومن قضايا الوصول من ناحية أخرىء فمن جانب التغطيةء فإن جميع 
مصادر البيانات محددة من ناحية العينةء وا مدى الجغراف» والوقت» ومتغيرات الصفات 
(الحقول) والمؤشرات. وق الواقع» فإن العام معقد بشكل كبير لغاية أنه يستحيل التقاط 

نطاق كامل وكافة فروقاته الدقيقة. وتناقضاته. وتبايناته. 


إن البيانات التي يتم جمعها من خلال دراسات البيانات الصغيرة تعد عينات بشكل 
صريح للغايةء وهي تجمع بشكل غير مستمر, وهي ذات رقم محدد من المتغيرات وذلك 
بالنظر إلى تركيزها المحكم والتكلفة المرتبطة بالجمع والتحليلء فمعظم هذه الدراسات 
تمثل دراسات أو تجارب منفصلة تركز على قضايا وحالات معينة ممجموعةء مؤسسةء elgi‏ 
أماكنء تقنيات... إلخ» وهي تفتقر إلى المكون الطولي حيث إنها Y‏ تغطي فترات زمنية 
متعددة وطويلة. فالدراسات التي تقوم بدراسة التغييرات بمرور الوقت عادة ما يتم 
تكرارها على فترات محددة. وق هذه الحالةء فإن فهمنا لظاهرة duszo‏ عادة ما يعتمد 
على مجموعة مقيدة من البيانات. وحتى عندما يتم تجميع وترقية مجموعات البيانات 
داخل البنى التحتية للبيانات» فإن التغطية تكون جزئية وانتقائية. فعلى سبيل ال مثالء فإن 
مجموعات بيانات الإدارة العامة الأيرلندية ذات تغطية محدودة وهي مملوءة بالفجوات 
والسكنات عن قطاعات معينة مثل قطاعات الإسكان والنقلء وغالباً ما يتم الاحتفاظ بها 
داخل المؤسسات )2007 (Kichin et al.‏ 

وعلى نحو مشابهء فإن البيانات الكبيرة رها تميل إلى أن تكون بيانات شاملةء ولكن وكما 
هو الحال مع مجموعات البيانات الأخرى» فإن كلتيهما تكون تمثيلاً وعينة. وهي تحلء 
بشكل fjr‏ فحسب» قضية صحراء البيانات التي يقصد بها أن تكون البيانات موزعة على 
مجاميع بيانات متفرقة يصعب استقاء البيانات منها أو إضافة بيانات اليها. وكما لاحظنا في 
الفصل الثاني» فإن البيانات التي يتم التقاطها تتشكل من قبل التقنية ا لمستخدمة: والسياق 
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الذي تم فيه إنشاء هذه البيانات» وتوصيف البيانات الذي تم توظيفه. فالبيانات المنشئة 
تمثل عادة ما يمكن التقاطه إلى حد ما بطريقة مباشرةء وهي تكون في غالب الأحيان منتجا 
فرعياً للنظام» ويكون مجالها الفوري مقيداً من قبل النطاق كسلاسل الأسواق المركزية, 
وشبكات المستشعرات. ومواقع التواصل الاجتماعي. وفيما يتعلق بالعلوم» فإن البيانات 
الكبيرة يتم إنشاؤها حاليا مما يتعلق بمجموعة منتقاة من الموضوعات «ali‏ وهي بعيدة 
كل البعد عن أن يتم إنتاجها عبر جميع النطاقات والبؤر العلمية. وعلاوة على ذلك. فإن 
القرار فيما يتعلق بإنشاء البيانات الكبيرة م يتشكل بعد ولكنه يتطور ويتركز من أجل توفير 
مجموعة من الرؤى» بحيث تشكل كل واحدة منها بعضا من العناصر التي يتم التقاطها 
e LL‏ والعمق» والتفاصيل... إلخ. وحتى عندما يتم دمج بيانات كبيرة مع مجموعات 
البيانات الأخرىء فإن مجالهم نكوق فا asc TCI‏ عن كود موا Bs CL. Te‏ 
البيانات الكبيرةء في هذه الحالةء لا تعالج مسألة صحاري البيانات وذلك فيما يتعلق بالكثير 
من مجالات الدراسة. 

وق الوقت تفنسه وق خن أن sj euo‏ البيانات Ulla‏ تواجدها مسهمراء فإن di‏ 
التحتية للبيانات والبيانات الكبيرة أنشأا طوفاناً من البيانات في بعض المجالات. وكما لاحظنا 
ف الفحسل ul]‏ كان هناك قر خوخ في حجم وسرعة إنتاج البيانات والتي تم تحديدها 
من أجل أن تنمو بسرعة عالية. وذلك مع إنشاء وبدء ا مصادر الجديدةء وتعقد مجموعات 
البيانات التي تم إنتاجهاء والمقدرة على ربط البيانات بعضها البعض. ومن شأن هذا الطوفان 
أن يفرض عددا من التحديات فيما يتعلق بالمناولة» واممعالجة, والتأمين والتصنيف, والفهم 
طثل هذه البيانات )2011 Sas (Gantz and Reinsel‏ من مجموعات البيانات الصغيرة 
وغير ا مستمرة. يحاول olla‏ الاستفادة من الكميات الهائلة من البيانات التي يتم تدفقها 

من أنبوب سميك. فمعظم هذه البيانات أصبحت بيانات عابرة وتم فقدهاء وم يتم lal‏ 
تحليلها أو الاستفادة منها. وبعض هذه البيانات قد تم تخزينها في مستودعات البيانات 
التي تمثل إلى حد كبير مكبات غير مراقبة (Asay 2013) SLAW‏ وهناك يتم الإبقاء عليها 
حتى تأت أوقات هكن لهذه البيانات أن تقدم فيها معلومات مفيدة. ونتيجة UI‏ وبينما 
تزداد نسبة البيانات بشكل تصاعديء فإن نسبة البيانات التي يتم معالجتها وتحليلها تقل 
بشکل .(Zikopoulos et al 2012) uS‏ وقد أشار )2012( Wu‏ إلى أنه في الوقت التي 
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تزداد فيه البيانات» يتم الحصول على معلومات أقل كنسبة من هذه البيانات. وبعبارة 
أخرىء تزداد ضوضاء البيانات بشكل كبر للغاية ولكن إشارات المعلومات تنمو بشكل أقل 
بكثير» وعلاوة على ذلكء يصبح الأمر أكثر صعوبة لعزل هذه البيانات في خضم هذه الضواء 
(انظر 2012 .(Silver‏ وهذا بلا جدال وظيفة البيانات الكبيرة وعلم البيانات حيث لا 
يزالان في أطوارهما الأولية» ومع الاستغلال الكامل للأساليب الحديثة والتي بإمكانها مراقبة 
ومعالجة وتحليل كميات هائلة من البيانات بشكل آني أو لحظي إلا أن هذا من المتعذر 
تحقيقه بشكل كبير. وحتى مع نضوج وتطور تحليلات البيانات الكبيرة» فإنه من المرجح أن 
تعاني من أجل تطوير طرق ومناهج يمكن من خلالها استخلاص التحليلات المفصلة وليست 
التحليلات السطحية؛ والتعامل مع أسئلة "SU"‏ وكذلك أسئلة "ماذا"؛ وتقديم إيضاحات 
وليس شروحات (انظر الفصل الثامن). وعلاوة على ذلكء يتعين تنويع هذه الطرق وذلك 
من أجل مجاراة الأشكال الجديدة من البيانات التي يتم إنشاؤها من قبل ا مصادر المبتكرة. 
وحتى مع تحقيق ذلك فإن مجاراة طوفان البيانات واستخلاص إشارات ذات مغزى من 
alis‏ ون اغ مما 


الوصول :(Access)‏ 
إن العائق الأساسي الآخر أمام الاستعانة مصادر مجموعات مناسبة للبيانات هو مدى 
قابلية الوصول إلى هذه المجموعات وقيود التراخيص التي تحدد معايير استخدام تلك 
المجموعات. وبشكل واضح. وكما ناقشنا في الفصلين الثاني والثالثء فإن الوصول يعتبر 
قضية أساسية فيما يتعلق بالبحوث والبيانات الممولة من قبل المؤسسات العامة والتي 
lat ios‏ الهيئات العامة فمحفوظات البيانات والبنى التحتية للبيانات ومبادرات البيانات 
de gzàLl‏ 5 تعني وتهتم بشكل كبير بمشاركة وإنتاج البيانات المتاحة للتحليل. وكما أوضحت 
ا مناقشات في الفصول JULI‏ إلبها سا فعلى e£ JI‏ من حقيقة أن البيانات غير تنافسية, 
وغير قابلة للاستثناء أو الإقصاء. ولها تكلفة هامشية عند استنساخها )2010 (Floridi‏ إلا أن 
البيانات مقيدة بشكل شائع وذلك عند توزيعها. وفي بعض الأحيانء فإن الوصول المقيد إلى 
البياناك کون Lal‏ مرغوبا فيه» وذلك إذا وضعنا في اعتبارنا طبيعتها الحساسية والشخصية 
وكذلك البعد الأخلاقي المرتبط بنشر واستخدام هذه البيانات (انظر الفصل العاشر). ds‏ 
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أحيان أخرىء يكون الوصول إلى البيانات مقيداً لأجل التأكد من أن هؤلاء الذين يحتفظون 
بهذه البيانات سيرفعون من قيمة هذه البيانات ويضيفون ميزات تنافسية لها أو يحققون 
أموالاً من خلال البيع او الترخيص للوصول لهذه البيانات (انظر الفصل السابع). وفي أحيان 
أخرىء رما ترغب إحدى الهيئات في تقييد توزيع البيانات نتيجة أنها تخشى ما oS‏ أن 
تكشفه هذه البيانات» والذي رها يكون له تداعيات سياسية أو اقتصادية» أو يكون مرد 
ذلك الخوف من كشف تدني جودة البيانات التي كانت محفوظة. 


وفي حين أن هذه المعوقات بدأت تتلاثى ببطء فيما يتعلق بالبيانات ا ممولة وا مستحدثة 
من قبل ا مؤسسات العامة في الدول الدمقراطية الغربية» إلا أن مثل هذه التحركات تعد 
أكثر Ula‏ مع تلك البيانات المستحدثة من قبل ا مؤسسات الخاصة. وف الواقع فإن هذا 
الأمر يعد متناقضا إلى حد ماء إذ إنه على الرغم من طوفان البيانات الكبيرة الناشئ, إلا 
أن الوصول إلى مثل هذه البيانات يظل AER lais‏ في الوقت الحالي» وذلك بوجود 
عدد محدود للغاية من الكيانات الغارقة في مثل هذا الطوفان والتي هكنها الوصول 
إليه )2011 (Crawford 2012, King‏ فالشركات من أمثال مشغاي الهواتف الخلوية, 
ومطوري التطبيقات» ومزودي وسائل التواصل الاجتماعي» وا مؤسسات اطالية. وسلاسل 
التجزئة» وشركات ال مراقبة والشركات الأمنية: لا يقع على كواهلها أي التزامات طمشاركة 
البيانات التي يستحدثونها من خلال عملياتهم التشغيلية بحرية. وعادة ما يتم التفاوض 
للوصول إلى البيانات بشكل فردي وهذا يتضمن توقيع العديد من اتفاقيات حماية امملكية 
الفكرية واتفاقيات عدم الإفصاح» وكذلك الموافقة على الشروط والبنود التي تحدد كيف 
وي أي غرض سيتم استخدام أو لا يتم استخدام مثل هذه البيانات. وحتى بعد كل dis‏ 
فمن المحتمل أن تمثل البيانات التي يتم توفيرها عينة محدودةء كما من الممكن أن تفتقر 
هذه البيانات إلى المعلومات السياقية مثل الكيفية التي تم تعيين هذه البيانات من خلالهاء 
أو تكون البيانات غير معالجة بشكل كبير أي لم يتم تنقيتها أو هيكلتهاء أو تكون ممُجمعة 
أو مجردة من المتغيرات المفيدة: أو معالجة بشكل أو بآخرء وذلك من شأنه أن يُقيد 
أساليب تحليل هذه البيانات. وفي بعض الحالات» يمكن أن يتم إتاحة كمية محدودة من 
البيانات للباحثين والجمهور وذلك من خلال واجهات برمجة التطبيقات Application)‏ 
.(Programming Interfaces -APIs‏ فواجهات برمجة التطبيقات تتكون من مجموعة 
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من الأوامر التي يمكن استخدامها من أجل استعادة البيانات المخزنة في قواعد بيانات على 
et‏ متاح الوصول إليه للجمهور )2011 .(Manovich‏ فعلى سبيل «JUL‏ يسمح تويتر 
لعدد محدود من الشركات بالوصول إلى كافة بياناته المتدفقة عبر موقعه» وذلك مقابل 
رسوم أو لأغراض تجارية. وهو يتمتع بالصلاحيات التي تسمح له بإملاء شروطه فيما 
يتعلق بالأغراض التي يمكن فيها استخدام مثل هذه البيانات. فالباحثون يتم تقسيمهم 
إلى قسمين: القسم الأول يمكنه الوصول إلى *٠١‏ من التغريدات العامة والقسم الثاني لا 
يمكنه الوصول إلا إلى >١‏ فحسب من التغريدات العامة أو يمكنهم الوصول إلى مجموعات 
فرعية مختلفة من المحتوى (الحسابات المدرجة في القائمة البيضاء). وذلك مع استبعاد 
التغريدات الخاصة وامحمية في جميع الأحوال )2012 jg .(boyd and Crawford‏ 
حال المواقع الإلكترونية التي تحوي على سبيل اممثال قوائم منتجات وتقييماتها Product)‏ 
(Listings and Reviews‏ وأدلة أعمال (Business Directories)‏ وكذلك في حال وسائل 
التواصل الاجتماعي والتي تتضمن اطلفات الشخصية العامة (Public Profiles)‏ والتغذية 
(Feeds)‏ فإن بعض الشركات مثل (80legs) (www.80legs.com)‏ وشركة Mozenda))‏ 
01 توفر خدمات زاحف الشبكة (أي تصفح الشبكة العامية بطريقة 
منهجية وآليه ومنظمة) وتجريف الشبكة (أي استخراج البيانات من مواقع الإنترانت عن 
طريق برامج مخصصة ) لحصد بيانات مفصلة من هذه المواقع أو للوصول لبيانات تغذية 

وما يقلق في هذا الأمر هو أن المعلومات التي هكن أن توفرها البيانات الكبيرة ا مملوكة 
للشركات الخاصة والتي تم بيعها بشكل تجاري سوف تكون محصورة على قطاع الأعمال 
فحسب» أو رها يتم إتاحتها مجموعة مميزة من الباحثين الأكاديميين الذين لا يمكن تكرار 
النتائج التي توصلوا إليها أو التحقق منها )2011 .(Lazer © al. 2009; King‏ ولا أحد 
من هذه المواقف يخدم المصلحة العامة. ولكن إذا وضعنا في اعتبارنا القيمة التجارية 
eoa‏ مطل dt lod‏ فاق 835 الوصول إل هذه bot‏ کون Jul de aga‏ 
فحقيقة أن البيانات الكبيرة الثرية من الناحيتين الاجتماعية والثقافية مملوكة للشركات 
الخاصة تشير إلى أنه في الوقت الحالي لن يكون من السهل في الواقع إجراء بحوث العلوم 
الاجتماعية الحسابية والعلوم الإنسانية الرقمية )2011 LSS .(Manovich‏ ذكر كلا من 
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boyd and Crawford (2012: 673)‏ فإن " الكثير من الحماس الذي يحيط بالبيانات 
الكيرة ينبع من الإذراك القائل ob‏ هذه البيانات توقر وضولا سهلاً لكميات هائلة من 
البيانات. ولكن من يتمتع بمثل هذه القدرة للوصول إلى هذه البيانات؟ ولأي غرض يتم 
الوصول؟ وفي أي سياق يجرى هذا الأمر؟ وما معوقات الوصول؟" فهذه أسئلة تتطلب 
الكثير من التفكير مع اتخاذ إجراءات مناسبة. 


6397 وصحة وأصل البيانات :(Data Quality, Veracity and Lineage)‏ 
جودة وصحة البيانات هما أمران مهمان للغاية كونهما يعززان المدى الذي يمكن أن يثق 

فيه المرء بالنتائج اللمستخلصة من تحليل البيانات. وترتبط جودة البيانات بمدى تنظيمها 
أي خلوها من الأخطاء والفراغات» ونقائها أي خلوها من التحيزء وتماسكها بمعنى أن تحوي 
القليل من التناقضات. بينما yis‏ مصطلح صحة البيانات إلى موثوقية البيانات وإلى مدى 
تمثيلها للمعنى الذي re‏ اليه بدقة (إتقان) وأمانة (إخلاص). ولهذا فإن تأسيس وتوثيق 
جودة وصحة البيانات يعتبر Laus à‏ 2 سلالة أصل البيانات. فسلالة أصل البيانات هي: 


المعلومات التي تصف مصدر الملاحظات. والمنهجيات التي خضعت لها البيانات عند 
جمعها وتصنيفهاء والتعديلات» والتحولات» والتحليل» والاشتقاقات التي تعرضت لهاء وهي 
توفر أيضا الافتراضات وام معايير التي تم تطبيقها عند أي مرحلة من مراحل حركة هذه 
البيانات» وكذلك أي تحيزات... وتوفر سلالة أصل البيانات مجموعة بيانات مع أصلها 
وتسمح للمستخدم أن يحدد مدى ملاءمة البيانات للاستخدام )2012 (Lauriault‏ 

وهي أيضا تصف بالتفصيل Laus‏ البيانات» ومن شأن الجودة والصحة وسّلالّة الأصل 
الضعيفة للبيانات أن يقوضنّ درجة الثقة والمصداقية التي يمكن أن يضعها الشخص في 
مجموعة البيانات والتحليلات التي اعتمدت على هذه البيانات. 

ومن الناحية التقليدية» فإن الدراسات القائمة على بيانات نادرة والتي يكون حجم 
الحيتات فبها صغسيرا في الغالب» فإن جودة وصحة وأصل البيانات تكون على قدر كبير 
من الأهمية. فإذا كان الشخص سيعمل على استخلاص نتائج عن السكان بالكامل وذلك 
اعتماداً على due‏ مثالية صغيرة فإنه يتين في هذه الحالة أن تكون العينة واضحة للغاية 
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وخالية من العيوب بأكبر قدر ممكنء ويتعين أن تكون على درجة عالية من الدقة والصحة. 
Jes‏ الرغم من «US‏ فإن عدد مجموعات البيانات يتم تشكيلها بشكل تام محدود للغايةء 
ويمكن استخدامها بدون أي شكل من أشكال تنظيف البيانات» بمعنى التحقق من الأخطاء 
وتصحيحها وإضافة البيانات المفقودة. ومعايرة وإعادة تهيئة البيانات حتى يمكن ربطها 
مع بيانات أخرى أو لتكون هذه البيانات سهلة الاستجابة gold‏ تحليل معينة (انظر 
الفصل السادس). ولذاء فإنه يتم استهلاك الكثير من العمل خلال تصميم البحث من 
أجل تقييد التحيزات المنهجية والتحيزات ال مرتبطة بتحديد العينات كي يتم التأكد من أن 
البيانات دقيقة وذات مصداقية بقدر الإمكان قبل تحليل أو مشاركة هذه البيانات. وتعمل 
المحفوظات الأرشيفية والبنى التحتية بشكل نشط من أجل التأكد من أن تظل مثل هذه 
البيانات ذات مصداقية ودقيقة وصحيحة رور الوقتء مع المحافظة على SL‏ أصل 
البيانات من خلال الاستقرار المؤسسيء وعمليات إدارة البيانات وواصفات البيانات» وتمكين 
نقل البيانات عبر مختلف الصيغات وال منصات Le‏ يحقق الؤامة بين الأجيال المختلفة من 
التقنيات )2012 .(Lauriault‏ وبدون مثل هذا العملء. فإن صحة البيانات المتضمنة del»‏ 
تلك البيانات سوف تتلاثى في القريب العاجل وذلك مع انعدام الثقة. 


وعلى النقيض من ذلكء ادعى البعض أن دراسات البيانات الكبيرة ليست بحاجة إلى 
تطبيق معايير جودة وصحة البيانات ذاتهاء وذلك يرجع إلى أن الطبيعة الكلية لمجموعات 
البيانات الكبيرة "ن- الجميع" n=all)‏ ) تجعلها تتخلص من التحيزات المتعلقة بتحديد 
العينات» وتقوم بالتعويض, أكثر من ال مطلوبء عن أي أخطاء أو ثغرات أو تناقضات في 
البيانات أو أي ضعف في صحة البيانات )2013 -(Mayer-Schonberger and Cukier‏ 
فالحجة التي استندت إليها وجهة النظر هذه أنه "مع وجود عدد قليل من الأخطاء المرتبطة 
بتحديد العينةء يمكننا تقبل أخطاء أكبر مرتبطة بالقياس" (ص 13)» "ويمكننا التسامح مع 
عدم "BI‏ (ص 16). إن الثمن المقابل ل "ن- الجميع" (n=all)‏ هو قبول الفوضى التي 
نشأت بشكل كبير من جراء صعوبة تنظيف البيانات ذات السرعة العالية وغير المنظمة, 
وتقبل البيانات كونها "محتملة أكثر من كونها دقيقة" (ص 35). وعند النظر إلى الأمر 
بهذه Äi hI‏ ادعى )2013 (Mayer-Schonberger and Cukier‏ أنه " كلما كان هنالك 
بيانات أكثر. كان ذلك أفضل" أو للتعبير عن هذا الأمر بشكل آخرء "إذا كان لديك بيانات 
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كثيرة عدا فان ما هو جيد بدرجة كافية تسد جيدا بدرحة كافية" )2011 oss (Helland‏ 
ثم فقد ادعى )211 :2012( Franks‏ أن المطلوب هو "بيانات نظيفة بدرجة كافية", وهي 
البيانات التي تمكن المحللين من "الحصول على النتائج التي يمكنهم الوثوق بها". وبالطبع 
فإن هذا يفترض أن جميع استخدامات البيانات الكبيرة سوف تتسامح مع عدم الدقةء في 
حين أن الواقع يشير إلى أن الكثير من استخدامات البيانات الكبيرة تتطلب الدقة بشكل 
ous‏ أو على الأقل بيانات ذات معايير الأخطاء التي هكن حسابها أي بيانات موثوقة. فعلى 
سبيل «JUL‏ فإن موقع خريطة الطريق المفتوح (OpenStreetMap)‏ يهدف إلى أن يكون 
في مستوى منتجات الخرائط الاحترافية من حيث التفصيل والدقةء ويهدف كذلك إلى كسب 
ds‏ شب تكد سف usa dias‏ | فن مساقو امات sel des‏ لانت تياف iss hos‏ 
ويكيبيديا (Wikipedia)‏ إلى أن تكون موسوعة دقيقة وموثوقة مثل الموسوعات الأخرى. 
وبطريقة مماثلة يتعين أن تكون البيانات المالية والبيانات الطبية دقيقة وصحيحة من أجل 
أن تغرس الثقة في نفوس التجار والأطباء والمرضى... والقائمة تطول. فمثل وجهة النظر هذه 
ua as‏ أيضًا أن شلال أصل البيانات Las‏ ضحة وموثوقية الائات ليست dab daga‏ 
مستخدمي البيانات. 


وبغض النظر عن تسامح بعض مجموعات بيانات البيانات الكبيرة تجاه عدم الدقةء إلا 
أن تحذير المعطيات الرديئة تؤدي إلى مخرجات رديئة لا يزال ساريا. فمجموعات البيانات 
الكبيرة التي تنشئ بيانات معيبة ورديئة» وتم التلاعب بها ومتحيزةء أو تنشئ بيانات ذات 
مصداقية ضعيفة» سوف تؤدي إلى تحليلات ونتائج ذات مصداقية ضعيفة وسوف تكون 
الفوائد المرجوة منها قليلة للغاية بالنسبة لهؤلاء الذين يحللون ويستفيدون منها. ويمكن 
للبيانات الكبيرة. عن طريق طرق إنتاجهاء أن تعاني من جميع العللء فالبيانات يمكن أن 
تكون duse‏ ورديئة من خلال أخطاء الأداةء حتى عبر التقنيات التي يفترض أن تكون ذات 
دقة عالية للغاية مثل نظام التموضع العالمي (GPS)‏ والذي تختلف دقته من جهاز لآخرء 
وعدد الأقمار الصناعية المتوافرة في وقت معين من الأوقات )2013 (Dodge and Kitchin‏ 
أو من الممكن أن يكون قد تم التلاعب أو التزوير في البيانات من خلال حسابات مزورة أو 
القرصنة من أجل التأثير على الاتجاه العام وتوجيه العامة نحو مسارات محددة )2013 (Vis‏ 
فعلى سبيل JELI‏ هناك مثات الآلاف من الحسابات المزيفة على تويترء وهي تشكل 76.0 
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من إجمالي حسابات المستخدمين على تويتر )2013 (De Micheli and Stroppa‏ وأيضًا ol‏ 
حتى XEO‏ من حسابات بعض العلامات التجارية بلتابعي تويتر هي حسابات آلية Calzolari)‏ 
22) وأكثر من درزنين من الخدمات تبيع حسابات تويتر مزيفة )2013 (Baym‏ 


فالبيانات يمكن أن تتسم بالتحيز جراء بعض الأسباب. إن الخصائص السكانية التي 
يتم اختيارها في العينات نادرا ما تكون شاملة وتتشوه إحصائيا من قبل الجنس.ء والنوع» 
والدخل» وامموقع» والعديد من العوامل الاجتماعية والاقتصادية الأخرى. فليس جميع 
الأشخاص يستخدمون تويتر أو الفيسبوك أو يتسوقون من محلات معينة» أو يكونوا 
مشتركين في شبكة الاتصالات ذاتها... Bollier 2010; Graham 2012: Crampton) eJ]‏ 
.(et al 2‏ فالتقنية ال مستخدمة والمعايير المطبقة تؤثر على طبيعة البيانات. فعلى 
سيبل اللقال» مكن أن Ss‏ تحديد المشازكات الأكثر قراءة أو مشاركة على وسائل التواصل 
الاجتماعي بشكل كبير من خلال خوارزميات الترتيب وليس الاهتمامات البسيطة Baym)‏ 
2013(. وعلى النحو 15« فإن واجهات برمجة التطبيقات تنظم ماهية البيانات التي يتم 
استخلاصهاء ففي تويترء على سبيل المثال» يتم التقاط الوسم ال مرتبط بالحدث وليس جميع 
التغريدات ذات الصلة )2013 «Burns‏ وأيضا فقد بين Gonzales - Bailon et al)‏ 
2) أن اختلاف طرق الوصول إلى بيانات تويتر - البحث في واجهات برمجة التطبيقات 
مقابل تدفق واجهات برمجة التطبيقات - يؤدي إلى الحصول على مجموعات مختلفة من 
النتائج. ونتيجة لذلكء لا توجد أي ضمانات ob‏ فريقين من الباحثين» على سبيل «JULI‏ 
الذين يحاولون جمع البيانات ذاتها في الوقت ذاته سوف يكونون قادرين في نهاية المطاف 
فى الحضول cle gane (e‏ البيانات ذاتها )2013 (Burns‏ وغلاوة على «US‏ فإن Jue‏ 
البيانات الوصفية وام متغيرات التي يتم توليدها والبيانات الوصفية والمتغيرات التي يتم 
تجاهلها يؤدي إلى رسم صورة معينة. ومثل هذه التحيزات تؤدي إلى انحراف أو حتى إلى 
نشوء أفكار واتجاهات وأشخاص ونماذج مستترة م يتم تصويرها أو تمثيلها في مجموعة 
البيانات )2012 (Graham‏ 

وفيها يتعلق بمصداقية البيانات» OB‏ الحال لا يتمثل ss»‏ في أن البيانات تعبر بصدق 
عما تم استخدام البيانات من أجل قياسه. فعلى سبيل JELI‏ هناك علامات استفهام 
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حول مدى حقيقة ودقة تعبير ا لمشاركات في وسائل التواصل الاجتماعي عن وجهات نظر 
الأشخاصء وعلى مدى الوثوق في مثل هذه المشاركات. وقد حذر (2011:6) Manovich‏ 
قائلاً إن "ا مشاركات» والتغريدات» والصور التي تم تحميلهاء والتعليقات» وجميع الأشكال 
المختلفة من المشاركات على الإنترنت لا تعتبر نوافذ شفافة بذاتهاء yas‏ من US‏ فهي We‏ 
مرتبة بعناية وتتم إدارتها بشكل منتظم وذلك من خلال الانتقادات نفسها التي تنطبق على 
بيانات المقابلات ومجموعات التركيز" (Focus Group)‏ وأبدى آخرون شكوكهم حيال 
صحة بيانات ele‏ المواطنة (Citizen Science)‏ والتعهيد الجماعي» وحذروا من daz‏ 
وعدم مقدرة الحشود على التنبؤ ومخاطر التفاوت (فيما يتعلق بالتغطية)» والمتغيرات 
(فيما يتعلق بالجودة والتجانس»» وتوليد البيانات المتحيزة المتأصلة في مشروعات المساواة 
الكبرىء التي تفتقر إلى القادة وتتشكل من مجموعة ضيقة من السكان ذوي التباين في 
المهارات والدوافع )2007 (Carr‏ وف الواقع» فإن وسائل التواصل الاجتماعي يهيمن عليها 
نخب رقمية غير ممثلة )2009 (Crutcher and Zook‏ في حين أن هناك مجموعات كبيرة 
من المجتمع مثل الفقراء وكبار السن Y‏ ينخرطون في وسائل التواصل الاجتماعي أو يفتقرون 
إلى الهواتف ASII‏ ومن ثم فإن أي بيانات يتم جمعها لا تعكس بالضرورة وجهات نظر 
هؤلاء الأشخاص أو أحيائهم )2013 (Crawford‏ ومن ثم فمن الضروري للغاية أن يتم 
تحديد ووضع مثل هذه التحيزات في الاعتبار وذلك عند تحليل البيانات من أجل كسب 
فهم أكثر شمولية للظاهرة, وخصوصاً إذا ما كان سيتم استخدام مثل هذه البيانات في أعمال 
السياسة العامة والقرارات التي تؤثر على حياة الناس كالنتائج الصحية. 

وعلاوة على ذلك» يوجد بعض المخاوف بشأن جودة وتجانس ال محتوى والبيانات الوصفية 
التي تم تكوينها عبر أفراد متنوعي المهارات والدوافع» ومخاوف بشأن كيفية توفير درجات 
موثقة من الاعتمادية وتكوين إحساس بالمصداقية )2013 .(Dodge and Kitchin‏ وقد 
أدى هذا بالبعض إلى افتراض أن عمل التعهيد الجماعي "الهواة" سيكون إجراؤه بشكل 
أفضل إذا بذل على تصحيح وتنويع البيانات وليس على تكوين البيانات )2007 (Carr‏ 
فالمثال الذي ألقى Carr‏ الضوء عليه هو موسوعة ويكبيدياء إذ على الرغم من كونها 
شهيرة وشاملة. إلا أنها تتوسع بشكل غير مدروس ماثل الاهتمامات المختارة للمشاركينء 
ويوجد بها مقالات غير كاملة وأحياناً مكتوبة بلغة ركيكة وتافهة ومطعون في صحتها بشكل 
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كبيرء مما يقوض حجيتها وإمكانية استخدامها أو نفعها. وادعى Carr‏ أنه " إذا كانت 
موسوعة ويكبيديا غير dla‏ فمن غير ا محتمل أن قراءها سيكونون أكثر تسامحاً تجاه 
تلك العيوب." (2007:4). وهمكن أن تعاني خريطة الطريق المفتوح (OpenStreetMap)‏ 
zs‏ التغطية في بعض الأماكن حيث يوجد عدد قليل من المتطوعين. ويوجد أيضًا بعض 
المخاوف بشأن استدامة أعمال التعهيد الجماعي التطوعية» حيث ادعى 2007 Carr‏ أن 
الارتباطات التي تربط مجموعة افتراضية من الناس سوياً Bale‏ ما تكون ارتباطات سطحية. 
وهي تفتقر إلى العمق والالتزام الإجباريء وعادة ما تكون عرضة للتشتت» وهي تعتمد 
بشكل كبير على مجموعة أساسية صغيرة لكي تحافظ على سير المشروع وتوفر الجزء الأكبر 
من العمل. وعلى النقيض من ذلك. لاحظ البعض أنه فيما يتعلق ب OpenStreetMap‏ 
فإن جودة البيانات المقدمة تطابق جودة البيانات التي تقدمها الشركات الاحترافية وأن 
التغطية متنوعة )2011 .(Haklay 2010, Mooney at al‏ 


فهذه ال مناقشة تلقي الضوء على أن كون مجموعة البيانات كبيرة للغاية من ناحية 
الحجم» فإن هذا لا يعني بالضرورة أنها عشوائية أو ممثلة للضاهرة أو صحيحة أو ذات 
مصداقية أو موثوقة. وكما لاحظ )2012( :boyd and Crawford‏ "كون البيانات الكبيرة 
تزودنا بكميات à Bla‏ من البيانات» OB‏ هذا لا يعني أن القضايا ا منهجية مم تعد ذات 
صلة. ففهم العينة على سبيل JEL‏ يعد أكثر أهمية الآن عما كان عليه الأمر في الماضي" 
(ص 668). وبالنسبة ل )615 :2009( Kelling et al.‏ فإن هذه القضية تعتبر قضية أصل 
ومنشاً أي "ا معلومات المتعلقة بأصل وتعريف وملكية وبنية" مجموعة البيانات التي تمكن 
محللي هذه البيانات من معرفة كيفية تكوين هذه البيانات ومعالجتهاء وتمكنهم كذلك 
من تقييم جودة وصحة البيانات. وعلى الرغم من ذلكء فإن مصدر معظم مجموعات 
بيانات البيانات الكبيرة مقيد بهؤلاء الذين قاموا بإنشاء البيانات» مما يجعل من الصعوبة 
بمكان تقييم صحة الدراسات ال منشورة التي اعتمدت على هذه البيانات. فأحد التحديات 
الرئيسية التي تواجه البيانات الكبيرة يتمثل في المقدرة على معرفة تفاصيل سلالة الأصل 
والذي يشمل تقييمات مستويات الأخطاء والشكوك في مجموعة البيانات» وإنشاء وسائل 
فعالة للتحقق من وتنظيف ومعايرة البيانات عالية السرعة وشديدة التنوع. 
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:(Data Integration and Interoperability) دمج وتوافقية البيانات‎ 

إن أحد الوعود التي انبثقت عن ثورة البيانات هو إنشاء مجموعات بيانات ذات ترابط 
قوي مما هكن هذه المجموعات من أن تتحد bgu‏ من أجل إنشاء قيم ومعارف إضافية. 

وكما اتضح من خلال تطور البنى التحتية للبيانات ومدمجي البيانات» فإن العديد من 
البياثات ias‏ لكي تندمج مع بعضها واتضح أيضًا أن الكثير من البيانات تظل منعزلة 
في مستودعات أو يمكن دمجها فقط من خلال معالجة إضافية كبيرة. ومن أجل أن يتم 
دمج البيانات في مجموعات بيانات جديدةء أو استخدام هذه البيانات بالاشتراك مع أي 
بيانات أخرىء فإن هذه البيانات تتطلب حقول تأشيريه مشتركة وتوفر معايير البيانات» 
وبيانات وصفية Aiuta‏ وتوافق على مستوى التنظيم والصيغة. وفي حين أن تقدماً كبيراً 
قد حدث في Bla]‏ البيانات وتطبيق معايير البيانات التي قادتها منظمات مثل المنظمة 
الدولية للمعايير (ISO)‏ ورابطة الشبكة العاممية (W3C)‏ واتحاد المعلومات المكانية 
ال مفتوحة (OGC)‏ في سبيل المحاذاة بين البيانات والبيانات الوصفية وتحسين التوافق بين 
ا لمنصات التقنية اممختلفة التي تعالج البيانات وتحتفظ dap‏ وتطوير البيانات المترابطة, 
إلا أن الكثير من مجموعات البيانات لا هكن ربط بعضها ببعض. فهي تشكل ما أطلق 
عليه )2012( Singh‏ مصطلح "البيانات الجانحة" (Stranded Data)‏ 

إن معظم دراسات البيانات الصغيرة لا تزال تنشئ بيانات جانحة كونها تستخدم لغات 
توصيف خاصة بها وأنظمة تنظيم البيانات التي تناسب الأغراض التي سيستخدمونها فيهاء 
ولكن القليل من هذه الدراسات تضع في اعتبارها قضايا التوسع والربط. وهذه هي أيضًا 
الحال غالبا داخل المنظمات التي يوجد بها إدارات منفصلة تستخدم أنظمتها الإدارية 
والتصنيفية الخاصة. فعلى سبيل «JULI‏ فإن كل واحدة من هيئات التخطيط التي يبلغ 
عددها مان وتمانين هيئة في إيرلندا تستخدم نظامها الخاص لاستخدام الأراضي وتصنيف 
المناطقء وعلاوة على ذلك. فهذه cola]‏ توظف العديد من ال منصات التقنية المختلفة 
لغرض إدارة وتخزين وتخطيط البيانات» فربط جميع هذه البيانات وتوحيدها في نظام 
وطني alo‏ ليس مهمة سهلة على الإطلاق. وبالمثلء فإن توسيع مجموعات البيانات 
الوطنية سوف يواجه مشاكل مماثلة. فعلى سبيل JULI‏ فإن ربط الإحصائيات السكانية 
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$ إيرلندا وإيرلندا الشمالية سوياً من أجل إنشاء مجموعة بيانات واحدة للجزيرة بالكامل 
يفرض عددا من التحديات الفنية وذلك يرجع إلى أن <۳١‏ من الأمئلة متطابقة, 05 XY‏ 
أخرى من الأسئلة يمكن أن يتم مضاهاتها وذلك من خلال تقسيم خطط التصنيف وإعادة 
تجميعها في الخطط المشتركة» وحتى إذا تم هذا فإن البيانات ستكون ذات جغرافيات 
إحصائية ضمنية مختلفة يتم تجميعها في وحدات مختلفة الأحجام )2007 „(Kitchin et al‏ 

وتتضاعف هذه القضايا عبر قارة أوروباء حيث تتبع كل دولة وكل مؤسسة إجراءات 
مختلفة (وحدات وتصنيفات)ء وتعتمد فترات زمنية متفاوتة (عدد المرات التي يتم فيها إنشاء 
(Ul‏ وتستند إلى أماكن متباعدة (الجغرافيا الإحصائية)» وتستعمل تقنيات مختلفة 
(الصيغ). ومن ثم فلقد استنتج )118 :2012( Rubert‏ أنه حتى مع وجود بيانات حكومية 
شاملة» إلا أنها في غالب الأحيان تتصارع تحت وطأة الأعداد التي لا تحصى من مجموعات 
البيانات المتضاربة وغير المتوافقة وغير الصالحة للمقارنة. وتسعى بعض اللمبادرات مثل 
توجيهات إنسبير (INSPIRE)‏ (البنية التحتية للمعلومات المكانية في ال مجتمع الأوروبي) 
إلى تكوين بيانات مشتركة عبر الجغرافيا الأوروبية الإحصائية المشتركة. ولكن الوصول إلى 
توافق في هذا الشأن يُعتبر عملية بطيئة وذلك يرجع إلى أن جميع الولايات لا ترغب 
في الانتقال بشكل أحادي (أي من طرف واحد) إلى نظام جديد للبيانات وخلال العملية 
يوقفون سجلاتهم الزمنية ويفقدون مقدرتهم على إجراء تحليلات زمنية متتاليةء إضافة 
إلى أن كل ولاية لها أولويات مختلفة فيما يتعلق بالبيانات التي ترغب في إنشائها وتتبعها. 

وتوجد هذه التحديات نفسها فيما يتعلق بالبيانات الكبيرة. والتي رها تكون غير 
متجانسة وغير منظمة بشكل كبير للغاية» ومتفاوتة فيما يتعلق بالجودةء وهي أيضا مرنة 
وقابلة للتوسع. فربط وتجميع مثل هذه البيانات ليس مهمة سهلة على الإطلاق وهي 
تتطلب تطوير مجموعة جديدة من الأدوات والأساليب» وكذلك إنشاء وتبني معايير جديدة 
للبيانات. فأحد الحلول ا مطروحة. والذي أشار إليه )2011( Short et al‏ هو دمج البيانات 
المخصص والذي يمكن المستخدمين من التحكم بسرعة وبشكل مباشر في أي من البيانات 
التي سيتم دمجهاء وذلك على الرغم من أن هذا يتطلب أن تكون مجموعة الّبيانات تتمتع 
بسمات معينة مثل البنية التحتية الدلالية المؤثرة. إن ربط وتجميع مثل هذه البيانات 
من ال ممكن أن يؤدي إلى التلوث المتقاطع (Cross-Contamination)‏ بسبب البيانات 
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ذات الجودة الضعيفة والحالة المتهالكة مما يؤدي إلى فساد وتلويث مجموعات البيانات 
الفعالة ويحولها إلى مجموعات بيانات ضعيفة. ومع ازدياد طوفان البيانات» فإن إيجاد 
الحلول التي تساعد على دمج البيانات وتوحيدها وتحافظ على سلامتها وفعاليتها سيمثل 
قضية ملحة. وذلك على الرغم من أن عدم المقدرة على ربط البيانات له جوانب إيجابية 
أيضا وذلك فيما يتعلق بتقييد مراقبة البيانات وتحسين أمن البيانات (انظر الفصل العاشر). 


:(Poor Analysis and Ecological Fallacies) التحليل الركيك وا مغالطات البيئية‎ 


جميع النتائج التي يتم التوصل إليها من الدراسات تكون دقيقة وسليمة وقوية بحسب 
البيانات التي تم استخدامها والتحليلات التي أجريّتء وإذا ما وضعنا جودة وصحة البيانات 
جانباء فخلال تصميم أي بحث يكون من eal‏ للغاية استخدام منهجية ملائمة وآليات 
مناسبة. فالإخفاق في فعل ذلك سيؤدي إلى مغالطات بيئية خطيرة عند تفسير النتائج» 
بمعنى استخلاص النتائج المضللة والتي في الواقع لا تدعمها البيانات المستخدمة. وهناك 
تاريخ طويل من ال مساجلات التي تتعلق بمكامن القوة والضعف النسبية في العديد من 
الأماط والأساليب المنهجية المختلفة» والظروف التي يمكن فيها تطبيق مثل هذه الأنماط 
والأساليب بشكل صحيح. وعلى وجه العموم» هناك الآن إرشادات وقواعد محددة بشكل 
واضح تتعلق بكيفية تكوين وتحليل أنواع مختلفة من البيانات عبر أنظمة متعددة. وعلى 
الرغم من CUS‏ وفيما يتعلق بالبيانات الكبيرةء فإن علوم البيانات لا تزال في أطوارها 
التمهيدية. ومثل هذه المعايير لا تزال في طور التشكيل والصياغة: فآليات جديدة يتم الآن 
اختراعهاء وتوسيعهاء وتقييمها. 

وهناك أربع LLAS‏ منهجية تتعلق بالبيانات الكبيرة جذبت الانتباهء فأولى هذه القضايا 
تتمثل في الإجابات المتفاوتة بشكل عميق والتي تؤدي إليها الافتراضات والمقاربات داخل 
النماذج )2012 (Silver‏ وثانياء مدى قدرة الآليات والأساليب المستخدمة على إحداث 
الاستسقاطء أي رؤية واستخلاص أنماط من البيانات العشوائية التي لا معنى dg)‏ أو إحداث 
فرط التعلم أو الملاءمة (Overfitting)‏ والتي تحدث عندما يصف نموذج إحصافي lb‏ 
عشوائيًا أو ضجيجًا بدلا من العلاقة الكامنة )2012 (boyd and Crawford‏ أو الخطأ 
في التعامل مع التشويش على أنه معلومات )2013 .(Silver 2012; Siegel‏ وثالث هذه 
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القضايا يتمثل في الاتهامات ob‏ بعض الآليات ا معينة تؤدي إلى ما هو أكثر بقليل من 
تجريف البيانات )2011 .(Data Dredging) (Webster‏ اشد إذا كان بإمكان الآليات 
أن تتوسع خارج نطاق بيانات ضبط الاختبار إلى مليارات السجلات المتدفقة في العام 
الواقعي )2008 (Bryant et al,‏ 


إن النماذج تهدف إلى توضيح والتعبير عن العلاقة بين المتغيرات وكيفية عمل النظام. 
فكل نموذج يتم تأسيسه على نظرية duszo‏ وبناؤه باستخدام مجموعة من الافتراضات 
والمقاربات التي تبين كيفية تفاعل المتغيرات» في حين أنه يتم اختبار صحة النموذج من 
خلال البحوث التجريبية» فإذا كانت النظرية والافتراضات غير صحيحة: فإن جميع التنبؤات 
ستكون غير صحيحة في هذه الحالة CUIS‏ وحتى التغييرات الصغيرة للغاية على الافتراضات 
في نموذج يمكن ما أن تؤدي إلى نتائج مختلفة تماماً. ففي حالة الأزمة المالية العالمية التي 
حدثت في العام 2008 ادعى )2012 (Silver‏ أن أحد العوامل المهمة للغاية في إحداث 
مثل هذه الأزمة كان استخدام نماذج تمويل دمجت ا مخاطر بحيث يمكن حساب احتمالية 
الدخل المحتمل مع الارتياب لأن المخاطر المحتملة من الصعب تقييمها. ونتيجة لذلك. 
اعتمدت النماذج على افتراضات غير يقينية ولكن تم معاملتها كما لو كانت مخاطر معروفة 
على وجه اليقين. والنتيجة كانت افتراض أن السندات JULI‏ الجديدة التي يحيط بها 
ارتياب نظامي عال للغاية هي أصول ذات مخاطر منخفضة: وهذا افتراض ثبت أنه خاطئ. 
وف الأنظمة المعقدة فإن مثل هذه الأخطاء لا يتم قياسها على أساس درجات ولكن يتم 
فياسها على أساس ترتيبها حسب الأهمية. وقد قدرت مؤسسات ستاندرد أند بورز وموديز 
(S&P and Moody’s)‏ مخاطر التخلف عن الدفع واممرتبطة بالتزامات الديون ال مضمونة 
(CDOs)‏ بأقل من قيمتها بعامل من مائتين )45 :2012 (Silver‏ وبغض النظر عن جودة 
البيانات الضمنيةء فإذا كان النموذج خاطنًاء فأي نتائج يتم استخلاصها من هذا النموذج 
ستكون خاطئة كذلك. 

لقد افترض )2013( Granville (2013) and Taleb‏ أن لعنة أو مأساة البيانات الكبيرة 
مُضاعفة. نتيجة العلاقات الإيجابية الخاطئة بين البيانات؛ وأنماط مجموعات البيانات التي 
تكون عرضية بشكل e L3‏ وليس لها أي قوى تنبؤية:» ولا يمكن تكرارهاء وربما يمكن أن 


۷۰ ثورة البيانات البيانات الكبيرة» والبيانات المفتوحة» والبنى التحتية للبيانات» والنتائج المترتبة عنها 


القضايا الفنية والتنظيمية 


تكون قناعاً لنماذج أضعف ذات أهمية. فمجموعات البيانات تشتمل غالباً على البيانات 
التي يبدو أنها مرتبطة بعضها البعض» حتى ولو كانت العلاقة بينها عشوائية في الواقع. 
ومع زيادة حجم مجموعة البيانات» تتضاعف الأخطاء الإيجابيةء إلى الحد الذي تكون فيه 
أي علاقة تقريبا بين البيانات مهمة من الناحية الإحصائية وفق معايير اختبارات الارتباط 
التقليدية )2013 deg .(Pentland 2012: Rajaraman et al. 2012; Taleb‏ النحو «l5‏ 
ففي أساليب التنقيب عن البيانات» مثل شجرة القرارات (تسلسل اتخاذ القرار)» مكن أن 
يتسم النموذج بفرط الملاءمة كي يتم استنباط نتائج استثنائية تحول إلى نتائج ÄLG‏ للتعميم 
مما يؤدي هذا إلى حدوث مغالطات بيئية. فالبيانات الكبيرة في هذه الحالة لا تعني معرفة 
أفضلء ولكنها تعني بالأحرى ارتباكاً أكثر وذلك من جراء صعوبة تحديد دالة حقيقية وسط 
ركام من الدلالات. ولذا فإنه: " أحياناً يكون الأقل هو الأقوى Verhulst) "L3b‏ تم الاقتباس 
من 2012:14 .(Bollier‏ 


إن أحد الجوانب المهمة في مشكلة الأخطاء الإيجابية ليس حجم مجموعة البيانات 
فحسب» بل كيفية معالجة وتحليل مجموعة البيانات هذه. فأحد أجزاء إستراتيجية الكثير 
من تحليلات البيانات الكبيرة يتمثل في فحص مجموعة البيانات قبل صياغة الافتراضات 
(انظر الفصل السادس». ومن الطرق المتبعة للقيام بهذا الأمر حساب الارتباطات بين 
جميع المتغيرات وذلك من أجل تحديد العلاقات المحتملة بين البيانات الجديرة بالدراسة 
الإضافية. وتشكل هذه العملية ما يعرف بتجريف البيانات (Data Dredging)‏ والتي 
تسمى أحياناً تصيد البيانات» وهي ممارسة لا يحبذها بشدة الكثير من الخبراء الإحصائيين 
(Webster 2011; Piatetsky-Shapiro 2012)‏ فالمشكلة التي ترتبط بهذا المنحى 
مشكلة مزدوجة. فمن جهة» هي تحدد آلاف الأخطاء الإيجابية المحتملة وذلك دون 
تحديد (el‏ من هذه الأخطاء عشوائي (sls‏ منها ذو مغزى. ومن dam‏ أخرىء يمكن أن تؤدي 
إلى التنقل من متجر لآخر طلبا للأرخص وعرض النتائج التي تؤكد اعتقاد ا محللء مع وجود 
دليل من التحليل المستخدم من أجل أن يجعل الادعاء يبدو معقولاً ومدروسا Webster)‏ 
Taleb 2013‏ ;2011(. فالسوؤال الشائك الذي يطرح نفسه هناء كما أشار Granville)‏ 
2013( هو كيف ممكن التمييز بين دالة حقيقية ودالة عرضية وسط الكميات الهائلة من 
البيانات؟ وكيف هكن ألا ينقاد المرء للاستسقاط وفرط التعلم؟ 
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إن هناك بعض الحلول الممكنة. حيث اقترح )2015( Rajaraman et al.‏ استخدام 
مبداً بونفيروني (Bonferroni)‏ والذي يسعى إلى تحديد الأحداث النادرة دا لدرجة أنها 
لا مكن أن تحدث في البيانات العشوائيةء وذلك من أجل فرز الارتباطات الفعلية عن 
الارتباطات العشوائية. كما كان )2013( Lusk‏ من أنصار استخدام مستويات معيارية 
معززةء وذكر نقطة انطلاق معيار خمسة سيجما (Five Sigma)‏ المستخدم حالياً في الفيزياء 
من أجل مواجهة الارتباطات الوهمية وإعلان الاكتشافات (احتمال كون النتائج خاطئة 
وناتجة عن التغيرات الإحصائية فقط هو واحد في كل ثلاثة ملايين وخمسمئة ألف أو 


بيانات أخرىء أو التقسيم العشوان لمجموعة البيانات الحالية إلى عينات ومعرفة إذا ما 
كانت العلاقة أو الارتباط سيظل وهو عبر العينات )2000 .(Jensen‏ وفيما يتعلق 
بفرط التعلم» ناقش )2010( Miller‏ إستراتيجية استخدام الخلفية المعرفية» والتي تتكون 
من استخدام الحقائق المعروفة عن مجموعة بيانات مستقاة من الافتراضات عن ehil‏ 
والحقائق الملاحظة. ومعرفة الخبيرء أو d s AI‏ أو المقاييس ا ممتعة وال مرغوب فيها التي 
تقيم البساطة والتيقن والفائدة والحداثة DUŠU‏ المستحدثة, وذلك من أجل فصل الأنماط 
الهادفة عن التشويش. وعلى الرغم من ذلك» فمن الواضح أن هناك حاجة لبذل أعمال 
إضافية من أجل تطوير أساليب لتقييم المغزى والدلالة في عصر البيانات الكبيرة. 

وإذا وضعنا في الاعتبار أن تحليلات البيانات لا Ul‏ في مراحلها الأولى من التطورء وتم 
تطبيقها بالدرجة الأولى على بيانات الضبط والاختبارء يظل أيضًا هناك بعض المخاوف 
بشأن فعالية مثل هذه الأساليب في مجاراة البيانات الفوضوية وغير ا منضبطة. وكما أشار 
Byrant et al. (2008: 4)‏ فإن "الكثير من الخوارزميات لا تتوسع خارج نطاق مجموعات 
البيانات التي تتكون من بضعة ملايين من العناصرء أو لا يمكنها أن تتحمل التشويش 
والثغرات الإحصائية الموجودة في بيانات العام الواقعي". فإذا كان هناك أي اختلالات أو 
تحيزات موجودة في الخوارزميات» فمن شأنها أن تؤدي إلى انحراف النتائج وتفسيرات هذه 
النتائج )2012 .(byoed and Crawford‏ ويرتبط بهذا التخوف أيضًا القلق من أن هناك 
اعت ماداً مفرطا والكثير جداً من ا موثوقية الموضوعة في الخوارزميات وذلك من أجل إجراء 
التحليلات. واستخراج المنافع وا مزايا التي تجلبها الخبرات والمعارف والفطرة البشرية من 
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أجل فهم ظاهرة ما )2012 (Lohr‏ ومن 3« هناك حاجة لإجراء المزيد من العمل من 
أجل تأسيس وتقييم صحة التحليلات الجديدة والثقة في النتائج التي يمكن استخلاصها من 
هذه التحليلات. 


ومن الانتقادات الأخرى الموجهة إلى تحليلات البيانات الكبيرة هو تركيز هذه البيانات 
على الآنية Ua)‏ والآن)» وذلك بالنظر إلى حداثتهاء وعلى وجه العموم» فإن البيانات الكبيرة 
تفتقر إلى العمق التاريخي. فشبكات الاستشعار الجديدة أو بيانات التعهيد الجماعي يمكن 
أن توفر بيانات مستمرة وثرية» ولكنها تتسم بقصر الفترات الزمنية التي تغطيها. ونتيجة 
لذلك» فإن الكثير من التحليلات تكون مناسبة في وقتها ولكنها تفتقر إلى العمق الزمني. 
وهذا أمر لا غبار عليه ومستحسن إذا كان الشخص مهتماً بالوقت الحاضر بتتبع حدث 
ممتد باستخدام وسائل التواصل الاجتماعي (على سبيل المثال حدث سياسي كبير مثل الربيع 
العربي)» أو أن يكون الشخص KG‏ بتحليل عملية مادية لا تتغير مرور الوقت (مثل تجربة 
فنزيائية):ولكن سيكون الأمر Las‏ للمشاكل إذا تم استخدامه من أجل فهم العمليات 
التي تمتد لآلاف السنين أو أكثر (على سبيل المثال الأنظمة البيئية والجيولوجية). وينطبق 
هذا الانتقاد أيضاء بالطبع» على دراسات البيانات الصغيرة. والتي تعتبر أيضا لقطات تم 
اتخاذها في أماكن معينة وأوقات محددة. 


المهارات والموارد البشرية :(Skills and Human Resourcing)‏ 
في حين أن بعض تحليلات البيانات يتم تركه ا للخوارزميات» وخاصة العمل المتعمق 
للمعالجة والحسابات. إلا أن أعمال التوجيه والتفسير لا تزال إلى حد كبير حكراً على اممحليين 
البشر. فبالاعتماد على مهاراتهم وخبراتهم ومعارفهم» يتخذ الباحثون والمحللون القرارات 
المتعلقة بالأماكن المثلى التي ينبغي التركيز عليهاء وكيفية صياغة وإجراء التحاليل» وإدراك 
المراد من النتائج والعمل على هذه النتائج. فالبشر يظلون هم الفاعلين الأساسيين في تأسيس 
وتشغيل والمحافظة على المشروعات التي تقودها البيانات» فعلى سبيل «JUL‏ يتطلب تأسيس 

بنية تحتية للبيانات مهندسي برامج وأجهزة ومسئولين رقميينء وأخصائيين في السياسة وخبراء 
مجالات علمية ومحللين. فهؤلاء العاملون يضمنون Jie lenia‏ للنظام ي ينتج بيانات 
مفيدة وصحيحة وموثوقة» ويوفرون الوسائل الضرورية لتخزين ومشاركة البيانات» ويؤمنون 
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مجموعة من الأدوات التحليلية والإدارية المناسبة» التي يمكنها استخلاص القيمة والمعرفة. 
وهم يعرفون أيضًا ماهية الأسئلة التي ينبغي توجيهها وما الذي يتعين فعله بالإجابات على تلك 
الأسئلة. ولذاء فإن المواهب البشرية بضاعة رائجة. ولكن وكما أشارت بعض التقاريرء هناك 
نقص متزايد في الموظفين الذين يتمتعون بمهارات في البيانات وخاصة محللي ومديري البيانات 
الذين بإمكانهم تحويل البيانات والمعلومات إلى معارف وعلوم );2011 Gantz and Reinsel‏ 
.(Manyika et al. 2011; Shah et al. 2012; Rooney 2012‏ 


وقد Manyika etal. (2012:3) 4S1‏ " أن الولايات المتحدة وحدها تعاني نقصًا يبلغ 

٠١‏ إلى ١1١,٠٠١‏ شخص يتمتعون مهارات تحليلية متعمقة وكذلك ١,0‏ مليون مدير 
ومحلل من أجل تحليل البيانات الكبيرة واتخاذ القرارات بناءً على اكتشافاتهم". واستطردوا 
بالإشارة إلى أن مثل هذه المواهب "من الصعب إيجادها |3 تستغرق سنوات عديدة في 
التدريب أو إعادة التدريب" (ص .)٠١‏ وقيم )2012( Shah et al.‏ عدد 0٠٠١‏ موظف في 
اثنتي عشرة شركة عاطية فيما يتعلق بمقدرتهم على معالجة تحليلات البيانات بشكل مثمر 
حيث قاموا بوضع الموظفين في ثلاث مجموعات. الأولىء التجريبيون غير المعترضين الذين 
يثقون في التحليلات أكثر من الأحكام الشخصية (LEY)‏ والثانيةء متخذو القرار المتعمقون 
الذين يتجاهلون التحليلات ويتصرفون با هليه عليه حدسهم الفطري )3( والثالثة, 
ا متشككون المطلعون (XY)‏ الذين يوازنون بين الأحكام الشخصية والتحليلات» ويسعون 
إلى تفسير البيانات ووضعها في سياقها المناسب عند اتخاذ القرارات. وبشكل مقلقء Ol‏ 
أولئك الذين يدعون البيانات تعبر عن نفسها وأولئك الذين يتجاهلون البيانات والتحليلات 
pe‏ روتيني يفوقون في عددهم أولئك القادرين بشكل أفضل على فهم البيانات الكبيرة. 
وعلاوة على ذلك» لاحظوا أن الشركات تعاني من أربعة مشاكل تحول دون الاستفادة من 
إمكانيات البيانات الكبيرة وهي: 
٠‏ أولاً: أن المهارات التحليلية تتركز في عدد محدود للغاية من الموظفين ولا تنتشر في باقي 

الموظفين. 
٠‏ ثانيا: أن حلول تقنية المعلومات تتركز بشكل تقليدي على التقنية وبشكل أقل بكثير على 

المعلومات في حين أن المعلومات هي المجال الذي يتم من خلاله جني القيمة. 
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Lb o‏ أن تخزين البيانات يحدث كيفما اتفق ومن الصعوبة كان على أي موظف أن 
يحدد مكان المادة إذا لمم يكن هذا الموظف هو المسئول عن جمعها. 


٠‏ رابعاً: أن المديرين يفهمون قيمة الموهبة ورأس JU‏ والعلامة التجاريةء ولكن لا يفهمون 
قيمة المعلوماتء ولا يبذلون جهوداً كافية من أجل فهم البيانات أو ترتيب هذه 
البيانات بشكل فعال وكفء. 

ويوجد Jta‏ هذا النقص ف المهارات أيضا في المؤسسات الأكاديمية. حيث إن خبراء 
المجالات المختلفة تدربوا في وقت ندرة البيانات وهم غير مستعدين بشكل كبير لعصر 
البنى التحتية للبيانات والبيانات الكبيرة وذلك باستثناء عدد لا يتجاوز أصابع اليد الواحدة 

من العلماء وامراكز. 


إن القلق الذي ينتاب الكثير من المعلقين هو أن المنافع المحتملة من الشركات والعلوم 
التي تقودها البيانات لن يتم تحقيقها بشكل كامل بسبب نقص المواهب البشرية وخاصة 
علماء البيانات الذين تجتمع لديهم مهارات مبرمجي البرامج والإحصائيين والرواة ا محترفين 
وذلك من أجل استخلاص شذرات الذهب المختبئة تحت Jue‏ من البيانات Cukier)‏ 
)واتديريق الق هعون LAS‏ وغول هذه الف eua‏ إل قرارات (ds docs‏ 
يتعلق بالمديرينء وكما أشار )23 :2012( Shah et al.‏ فإن "الاستثمار في التحليلات يمكن 
أن يكون بلا جدوىء ويمكن حتى أن يكون ضاراء إلا إذا كان بإمكان الموظفين دمج هذه 
البيانات في العملية ال معقدة لاتخاذ القرارات". فالجامعات بدأت الآن في إنشاء برامج 
جديدة ومراكز بحثية لعلوم البيانات» ويسعون إلى تعديل الدورات التدريبية الحالية لي 
تشتمل على التدريب على مجموعة اممهارات الجديدة هذه وذلك في مسعى إلى تنقيح 
بعض الثغرات المتعلقة بال مهارات. ويتم تنظيم بعض هذه البرامج با مشاركة مع بعض 
الشركات. فعلى سبيل «JL‏ بدأت شركة آي بي (IBM) el‏ بالفعل في العمل مع العديد من 
الجامعات من أجل تطوير دورات ومقررات تعليميةء وهناك بعض الشركات الأخرى مثل 
شركة تيراداتا (Teradata)‏ التي تقدم برامج تدريبية معتمدة من الجامعات Bertolucci)‏ 
2013( وذلك على الرغم من أن هذه البرامج من الممكن أن تؤدي إلى مخاطرة توجيه 
الطلاب تجاه رؤى وبرامج خاصة ببعض الشركات. 
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الجدول رقم Y)‏ - 3( 


الخبرات اللازمة لبناء البنى التحتية للبيانات وإجراء بحوث البيانات الكبيرة 


خبرات اممجال o‏ معرفة نظرية وعملية عميقة با مجال (المجالات) ذات الصلة. 
٠ | Domain Expertise‏ المعرفة التامة بأنواع البيانات التي ستتم دراستها وأصل هذه البيانات 
وأهميتها للمجال (المجالات) ذات الصلة. 
o‏ المقدرة على تحديد الفجوات المعرفية. 
o‏ المعرفة التامة بالأدبيات والاتفاقيات النظامية. 
٠‏ المقدرة على تعليم الآخرين الذين يملكون خلفيات متعددة من أجل 
استيعاب كل ما ذكر أعلاه. 
خبرات البيانات ٠‏ فهم كيف يتم تجميع البيانات والمحافظة عليهاء وكذلك فهم العلاقات 
بين الأشياء المادية والتمثيل الرقمي لهذه الأشياء (إذا كان ذلك ممكنا). 
٠‏ المعرفة التامة بنماذج البيانات و/ أو اتفاقيات وصف البيانات. 


Data Expertise 


٠‏ فهم كيف يتم الوصول إلى البيانات ذات الصلة وتخزين هذه البيانات. 

٠‏ المقدرة على تسهيل مشاركة البيانات وتصحيح الأخطاء بشكل يدوي» 
سواءً كان هذا أثناء el‏ بعد المشروع. 

٠‏ المقدرة على التنبؤ بالاستخدامات المستقبلية أو البديلة للبيانات. 

٠‏ فهم الأشكال الجديدة من اللمطبوعات التي يمكنها أن تحتوي على البيانات. 


الخبرات التحليلية ٠|‏ فهم نقاط القوة والضعف في أدوات البحث الفردية. 


e | Analytical Expertise‏ اختيار وتعديل الأدوات المناسبة لدعم الأهداف البحثية. 
e‏ التنبؤ با مشاكل التي يمكنها أن تنشأ مع استخدام الأدوات المختارة 
لتنفيذ مهام المشروع. 
٠‏ توقع واكتشاف معدلات الأخطاء في خوارزميات البيانات وتحليلات 
البيانات» واختيار الطرق الإحصائية التي تفسر هذه الأخطاء كلما كان 


ذلك مناسبا. 


٠‏ تعليم الآخرين كيفية تفسير نتائج البحث. 
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خبرات إدارة gU‏ «المقدرة على صياغة معام اطمشروع. 
ALI e Project Management‏ 84 على تحديد الأهداف المناسبة واممواعيد النهائية وتنسية 
expertise‏ مسارات العمل الممتوازية ]18 كان ذلك ضروريا. 


e‏ المقدرة على اختيار أفضل الإستراتيجيات المناسبة للاتصال والتوثيق 


٠‏ إجادة الأدوات البحثية التعاونية. 
٠‏ الإرادة القوية للعمل من أجل تحقيق النتائج التي تفيد جميع أعضاء 
الفريق. 


. Williford and Henry (2012: 16 - 20) المصدر: مقتبس من‎ 


إن علم البيانات ليس هو الخبرة الوحيدة التي يتعين تأسيسها. وبحسب ما ادعى 
Williford and Henry (2012)‏ فإن تأسيس بنى تحتية للبيانات وإجراء البحوث على 
البيانات الكبيرة يتطلبان دمج أربعة أنواع من الخبرات من أجل تحقيق النجاح (انظر 
الحدول .(3-Y‏ وهذه الخبرات الأربعة كما ادعى )2013( Rubert‏ ممكن أن يتم تحقيقها 
فقط من خلال منهج متعدد التخصصات والقطاعات» مما يسمح بتوحيد امطهارات والرؤى 
التي هكنها أن تتقاطع مع المجالات وتحقق التعاون بين المؤسسات الأكاديمية والصناعية 
والحكومية. وحتى b‏ مثل هذا الوقت» أي عندما يتطور وينضج جيل جديد من ا مواهب 
المناسبة» وتتطور مناهج متعددة المجالات والأنظمة» فإن المشروعات ستظل عرضة للإخفاق 
أو سوء الأداء. 





الخاتمة: 

كشف هذا الفصل عن أوجه النقص الفنية في البيانات الصغيرة المتوسعة والبيانات 
الكبيرة. وناقش أن البيانات الكبيرة تحيط بها العديد من القضايا التي تحول دون الاستفادة 
منها وتطويرها في الوقت الراهن» ومن هذه القضايا على سبيل الذكر لا الحصر النطاق 
الضيق إلى حد ما مجموعات البيانات المتوافرة. والوصول المحدود إلى البيانات» والجودة 
الضعيفة للبيانات» وصحة وموثوقية البيانات. وسُلالة أصل البيانات المحددة بشكل سيئ» 
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والتبادلية الضعيفةء والتحليلات المشكوك فيهاء والمغالطات didl‏ وقاعدة المهارات المطورة 
بشكل ضعيف» والاستجابة المؤسسية. وقد أدى ذلك ب )2012( Dembosky et al.‏ 
للادعاء ob‏ "التحركات الأولية رها تكون واعدة بشكل مفرط ولكن أداءها رها يكون أقل 
من اللتدقع ": وخصوضا غندما grues‏ هوك الذين sis‏ خلول البيانات الكبيرة gasi"‏ 
بسبب التقنية التي لا تزال حديثة للغاية وغير منقحة, ا ا 
أكثر من كونها مفيدة". وبمرور الوقتء فإن الكثير من هذه القضايا سيتم التعامل معها إلى 
حد ما وذلك من خلال الحلول الإدارية والفنيةء ولكن ستظل هذه القضايا تشكل مخاوف 
callis‏ اهماما hatas‏ دعملا atas daan Lobo]‏ الأمر كاك Goal‏ على Slesia‏ 
البنى التحتية للبيانات ومشروعات البيانات المفتوحة. وف الواقع» وكما أشرنا إلى ذلك في 
الفصل الثالثء فإن الكثير من هذه القضايا التي تؤثر على البيانات الكبيرة تؤثر بشدة في 
مشروعات البيانات المفتوحة. فعلى سبيل «JULI‏ فإن بعض مواقع البيانات المفتوحة لا تعد 
أكثر من كونها مقالب نفايات للبيانات ذات المتغيرات الانتقائيةء إذ إن هذه ا مواقع منظمة 
بشكل سين للغاية وهي ذات بنية ضعيفة تماما وبياناتها غير نظيفة: وهي تفتقر إلى 
مجموعات التسجيل الكاملةء والتوثيق» والسياسات المتعلقة بالحفظء والنسخ الاحتياطيء 
والتدقيق» وإعادة الاستخدام» والخصوصية والسياسات الأخلاقية. 


ر يتعين علينا ينا أن نكون حريصين للغاية من a pus‏ ندرك jns uh‏ البيانات لا Ma‏ 


الراهن, يبدو أن التسابق يتجه نحو abi‏ نظم تھ me "n dag‏ الإمكانيات حصة 
سوقية مبكرة دون بذل الجهد الكافي لتفحص المصداقية والفعالية والمنفعة, أو لتفحص 
القضايا الإدارية والموارد البشرية التي تتعلق بالجاهزية المؤسسية ومجموعات ال مهارات 
ا مناسبة. وفي الواقع» فإن شعار بعض المشروعات هو أن تتجه نحو ما هو مستهجن بشكل 
مبكر ثم تتعامل مع القضايا التي تنشأ على أساس انتشارها. 

ونتيجة لذلك» فإن البحوث المركزة بشكل كبير وا مصممة من أجل تحديد طبيعة ومدى 
أوجه القصور الفنية وام مؤسسية للبيانات الكبيرة والبيانات اممفتوحة والبنى التحتية للبيانات 
لا تزال متأخرة بشكل واضح مقارنة بأعمال التطوير الأخرى. ولكن مثل هذه البحوث 
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تظل حيوية للغاية لإنشاء أنظمة تقدم اكتشافات ونتائج صحيحةء ومن شأنها أيضًا أن 
تضيف قيمة كافية للمؤسسات التي تتبنى وتستخدم هذه البحوث. ويتعين أن يتم إجراء 
هذه البحوث عبر قطاعات متعددة وعبر الأنواع المختلفة من البيانات وذلك من أجل 
تأسيس القضايا والحلول المتعلقة بالبيانات والأنظمة المختلفة. وعلاوة على ذلكء يتعين أن 
يتم تخصيص استثمارات من أجل زيادة وصقل مهارات ال موظفين الحاليين وتدريب جيل 
جديد من علماء البيانات» ودون إجراء مثل هذه البحوثء فإن البيانات الكبيرة» والبيانات 
المفتوحة والبنى التحتية للبيانات رها ستعاني أضرار السمعة التي ستؤدي في نهاية المطاف 
إلى بطء في نشرها وتبنيها. وهناك مجموعة أخرى من القضايا التي ستؤدي الدور ذاته 
وهي القضايا المتعلقة بالآثار الأخلاقية والاجتماعية والسياسية لأنظمة البيانات الجديدة 
وهو ما يركز عليه الفصل التالي. 
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الفصل العاشر 
المخاوف الأخلاقية, والسياسية»ء والاجتماعية, والقانونية 


(Ethical, Political, Social, and Legal Concerns) 


كما نوقش في الفصل السابع» يتم تكوين وتوظيف البيانات للعديد من الغايات التي 
تشمل حكم المجتمعات, وإدارة المنظمات» والتوسع في الأرباح» وتنظيم الأماكن. وف جميع 
هده الحالات» 353 البيانات مدخلات أساسية في الأنظمة التي يتم تنفيذهاء للمفارقةء لغرض 
أن تكون المجتمعات أكثر أماناء وأمناء وتنافسية» وإنتاجية» وكفاءة, وشفافية ومساءلةء على 
الرغم من أنه يتم القيام بذلك من خلال العمليات التي تراقب وتفرض النظام» وتكبح» 
quis‏ وتجبر» وتستغل الناس. فهناك توازن دقيقء في هذه الحالةء بين استخدام البيانات 
بطرق تحريرية وتمكينيةء وبين استخدام البيانات من أجل تحقيق أغراض الفرد الشخصية 
وإلحاق الضرر بالآخرينء أو استخدام البيانات بطرق تتعارض مع رغبات هؤلاء الذين 
تمثلهم هذه البيانات. ولا يتعلق الأمرء مع ذلك» Ob‏ تستخدم البيانات ببساطة في أشياء 
جيدة أو أشياء سيئة» فا مشكلة أعقد من ذلك بكثير. وفي غالب الأحيان فإن النتائج التي 
تظهر على أنها متعارضة يتم تجميعها سوياً لدرجة أن الأشخاص يكن تحريرهم أو إجبارهم 
في الوقت نفسه - وهم يحصلون على منافع شخصية في الوقت ذاته الذي يقعون فيه 
في مصيدة النظام الذي يسعى إلى تحقيق مكاسب من وراء مشاركتهم. وفي مصطلحات 
Althusser (1971)‏ تعمل مثل هذه الترتيبات من خلال الاستجواب» وتوريط الناس عن 
طريق منطقها وذلك من خلال الإقناع والحوافز. فعلى سبيل اممثالء تمنح بطاقات الولاء في 
الأمواق للعملاء خصومات في الوقت ذاته الذي تعمل هذه البطاقات على تأسيس الولاء 
تجاه المتجر وتكوين قدر من البيانات التي يتم استخدامها من أجل محاولة بيع المزيد من 
البضائع لهؤلاء العملاء مما يؤدي إلى زيادة الأرباح. وبا مثل: فإن تمن حصولك على الأمان 
من الهجمات الإرهابية هو المراقبة التي تنتهك خصوصيات جميع الأفراد في ا مجتمع. حيث 
يحصل المواطنون على الأمان مقابل خصوصيتهم. 
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إن تكوين البيانات والعمل الذي تقوم به مثل هذه البيانات محاط بشكل جوهري 
بمخاوف أخلاقية» واجتماعية» وسياسية. ومثل هذه المخاوف كانت لوقت طويل مثار 
إدراك ومجادلات داخل المنتديات العامة والمنتديات العلمية: مما أدى إلى صياغة مجموعة 
كبيرة من الإرشادات الأخلاقية d alls‏ والتشريعات التي تحدد كيف يتم إنتاج إدارة, 
«dS Uie‏ واستخدام البيانات. فليس هناك أي شكل من أشكال إنتاج وتحليل البيانات خال 
من مثل هذه المخاوف» وحتى المشاريع العلمية التي يبدو من الناحية الظاهرية أنها غير 
خطرة ومحايدةء يمكن أن تثير أسئلة أخلاقية ويكون لها توابع اجتماعية وسياسية. فعلى 
سبيل e) JU‏ يبدو ظاهريًا أن قياس ونمذجة الأنظمة البيئية يكون مقتصراً على فهم 
الظواهر الطبيعيةء ولكن من الممكن أن يتم استخدام ذلك أيضا في تشكيل السياسات التي 
تؤثر في حياة الناس داخل مثل هذه الأنظمة. إن مثل هذه الحوارات الأخلاقية مستمرة 
وتتطور واحدة تلو الأخرى مع المجال الاستطرادي الأشمل الذي يتعلق بالاتجاهات والآراء 
الاجتماعيةء وتطور التقنيات الجديدة. وفيما يتعلق بالأخيرةء فإن توسيع البيانات الصغيرة 
داخل البنى التحتية للبيانات» وإنشاء سوق البيانات الهائلء وفتح البيانات المؤسسية, 
وتدفقات البيانات الكبيرة يطرحان أسئلة أساسية AEM‏ واجتماعية» وسياسية: إذ إنها 
تعدل بشكل جذري مشهد البيانات. إن حجم وتنوع البيانات التي يتم تكوينها عن جميع 
مجالات الحياة اليومية والعامم الذي نعيش فيه اليوم ينموان بشكل laa‏ وهذه البيانات 
هي أكثر من أي وقت مضى من حيث مناسبة توقيتهاء وتصميمهاء وشموليتهاء وترابطها. 
فما كان في الماضي ule‏ و أصبح الآن وبشكل متزايد مكشوفا أمام مجموعة 
متنوعة من امصالح» وعمليات اتخاذ القرار داخل الحكومات» وأصبحت الأعمال توجه 
بالبيانات بشكل oS]‏ ومدعومة بالدليل وأكثر اعتمادًا على التقنية (تكنوقراطية). 

يناقش هذا الفصل مجموعة مختارة من ال مخاوف الأخلاقية, والاجتماعية, والسياسية, 
والقانونية التي تثيرها ثورة البيانات» وهذه ا مخاوف تشمل مراقبة البيانات وتعقب 
البيانات» والخصوصيةء وأمن البيانات» والتشخيص. والتصنيف الاجتماعي والخطوط 
الحمراء (Redlining)‏ والتي تعني ممارسة الحرمان أو زيادة التكلفة في الخدمات لمناطق 
لها غالبية عرقية محددة sU‏ على البيانات» والتحكم في الانسلالء والحوكمة التوقعية, 
وحوكمة المؤسسات. والاعتماد التام على التقنية وحوكمة الشركات والإغلاق التقنيء والملكية 
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وحقوق املكية الفكرية. فالفصل يناقش كيفية التفكير في كل قضية من هذه القضاياء مع 
الآراء المتباينة داخل كل ele‏ على حدة وبين العلوم المختلفة بعضها البعض» وكذلك داخل 
وبين الشركات والحكومات والمجتمع المدني» ومن لديه أجندات مختلفة. ومصالح مكتسبةء 
وحساسيات سياسية. ولذاء فإنه لا توجد إجابات سهلة لحل هذه القضايا التي يناقشها 
هذا الفصلء في حين أن الحلول تتكون دوماً من تسويات وحلول وسط. ومن المؤكدء على 
ما ذكرناء أنه كلما تنتشر ثورة البيانات» فمن المرجح أن تزداد حدة ال مناقشات والجدال 
بشأن هذه المخاوفء وخصوصاً عند القيام محاولات من أجل صياغة تشريعات جديدة 
للتعامل مع التطورات التقنية التي تساعد على انبثاق طرق جديدة لإنشاء وتعزيز وتحليل 
البيانات» ومن ثم تؤدي إلى ظهور قضايا جديدة مما يجعل من التشريعات والقوانين 
القديمة تشريعات وقوانين عفا عليها الزمن. 


تعقب البيانات ومراقبة البيانات :(Data Shadows and Dataveillance)‏ 
كما ناقشنا في الفصول السابقةء يتم تكوين كمية هائلة من البيانات في الوقت الراهن 
وذلك فيما يتعلق بالمواطنين في جميع ولايات الدولة. إن إنتاج وتحويل مثل هذه الكمية 
من البيانات ينمو ويتزايد باطراد. حيث تسعى الدولة والشركات ومنظمات ا مجتمع المدني 
بشكل فعال للحصول على البيانات المتعلقة بمواطنيهم وعملائهم والأعضاء المشتركين في 
أنشطتهم. وف الواقع» أصبح من الصعوبة بمكان أن يؤدي الفرد جزءًا من حياته اليومية 
دون أن يترك ST‏ لذلك بسبب الدور غير المباشر للتقنيات الرقمية والبرامج واستخدام 
المعرفات الدالية )2011 (Kitchin and Dodge‏ فحتى ولو م يقم المشتري باستخدام 
بطاقته الائتمانية لشراء البضائع من المتاجرء إلا أن حضور هذا ا مشتري قد تم تسجيله 
من خلال كاميرات المراقبة» وحتى لو استخدم الشخص اسم مستخدم مجهول على وسائل 
التواصل الاجتماعي فإنه يتم تسجيل عنوان بروتوكول الإنترنت (IP Address)‏ وعنوان 
التحكم بالوصول للوسائط (MAC Address)‏ ومن ثم فنحن نترك آثار البيانات بشكل 
روتيني في أعقابناء على الرغم من أننا في الغالب لا نمتلك السيطرة الكاملة على شكل ومدى 
وكيفية استخدام هذه الآثار. 
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وكما أشار )2011( Koops‏ على سبيل المثال» فإن هيئة حماية البيانات الهولندية 
قدرت أن المواطن الهولندي العادي مندرج في نحو 00١0 - ۲٠١‏ قاعدة بيانات» في حين 
أن المواطنين الأكثر نشاطا من الناحية الاجتماعية مندرجون في نحو ٠٠٠١‏ قاعدة بيانات. 
ولا تشتمل قواعد البيانات هذه على الآثار الرقمية للمواطنين فحسب (البيانات التي 
يتركها المواطنون أنفسهم في (eap is]‏ ولكنها تتضمن أيضًا بيانات الصور التخيلية Data)‏ 
75 الخاصة بالأفراد (البيانات عن المواطنين التي ينشئها الآخرون)» وهي توفر 
بشكل متزايد عملية تعقب البيانات الخاصة بالموقع والتفاعلات وا معاملات عبر المكان 
والزمان )2011 .(Clarke 1994a; Lyon 2007; Dodge and Kitchin 2005; Koops‏ 
وعلاوة على ذلك» ففي حين أن الآثار الرقمية والصور التخيلية للبيانات سريعة الزوال ولا 
تدوم إلا فترة محدودة «DJ‏ فإن النسخة الرقمية منهما تدوم بشكل كبير للغاية ويمكن 
تخزينها في قواعد البيانات لفترة غير محدودة )2011 (Koops‏ مما يؤدي إلى إنشاء 
عام من الممكن له أن يتذكر جميع نقاط البيانات ولا ينسى على الإطلاق Dodge and)‏ 
.(Kitchin 2007b‏ فهذه الآثار الرقمية والصور التخيلية للبيانات يتم تفتيتها وتقسيمها 
ونشرها عبر الكثير من ال منظمات والخوادم» وهي تكون عرضة للدمج والتقسيم Raley)‏ 
3. وف أفضل الأحوال. تشكل الآثار الرقمية والصور التخيلية للبيانات القليل من 
الرؤى - رؤى محدودة من زوايا مرتفعة جزئية من مواقف محددة مع إسقاط الرؤى 
المحددة )2002 (Amin and Thrift‏ - وذلك بدلاً من تمحيص هذه الآثار والتخيلات 
سوياً من أجل تكوين رؤية شاملة وعامة تحيط بكل شيء. وعلى الرغم من US‏ وإذا 
وضعنا في اعتبارنا ارتباطية البيانات وقيمة تضخيم البيانات» فإن الاتجاه السائد سيكون 
تجاه تجميع وجهات النظر المحدودة من أجل تكون تصور أكثر قوة. 

als‏ توفر الآثار الرقمية والصور التخيلية للبيانات سجلاً مفصلا بحياة المرء اليومية, 
وأنماط استهلاكه. وعمله» وسفره. واتصالاته» ولعبه» وتفاعلاته مع ا لمنظمات,. وأفكاره 
واهتماماته. وليس الأفراد فحسب هم من يقعون تحت طائل هذه ال مراقبة الشاملة» ولكن 
هذه المراقبة تشمل أيضًا الأشياء والمؤسسات والتعاملات والمناطق Dodge and Kitchin)‏ 
s .(2005‏ يحدث à lul‏ السابق أن يتم تكوين مثل هذه الكمية من البيانات عن حياة 
الناس الاقتصادية والاجتماعية بسهولة بالغةء وأن يتم إتاحة هذه البيانات على نطاق glo‏ 
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للغاية من خلال أسواق البيانات والبنى التحتية للبيانات ومبادرات البيانات المفتوحة. 
وف الواقع: فإن اكتساب الوصول إلى البيانات الحساسة ليس la sho‏ على الحكومات 
والشركات والنظمات وذلك سبي أن مراقية النظراء أصبحت أمرا lj ast Ki‏ بفكل 
نسبي دون معرفة أو دون الحصول على إذن الشخص الخاضع للمراقبة Andrejevic)‏ 
7. وبالطبع» كان هذا الأمر متاحاً على الدوام من خلال التطفل والقيل والقالء ولكنه 
أصبح أكثر سهولة في الوقت الحالي من خلال الإنترنت سواءً كان هذا من خلال البحث عن 
البيانات أو شراء تلك البيانات» أو من خلال استعراض سحلات الأجهزة الرقمية كالهواتف 
الخلوية» وبرامج تصفح الإنترنت» أو برامج الملاحة بالأقمار الصناعية في السيارات... وغير 
«t‏ ]9 من خلال وضع الجهزة مراقة رخيصة تسا io‏ الكامرات الدقيقة المسقرة. وكا 
ناقشنا في الفصل الثاني» فإن سماسرة البيانات يسمحون بدراسة تواريخ الأشخاص وذلك 
فيما يتعلق ببعض المسائل مثل الحالة الاجتماعيةء والإفلاس» وملكية العقارات» والتاريخ 
الوظيفي» والسجلات الجنائية» والحالة الضريبية ودعاوى العنف الجنسي أو العنف الأسريء 
والخلفية التعليمية... وغير ذلك. 

ومن ثم فإن طوفان البيانات مكشوف أمام مراقبة البيانات والاستغلالء فمراقبة 
البيانات» تعد أحد أساليب اللمراقبة التي يتم تفعيلها من خلال فرز وتدقيق مجموعات 
البيانات وذلك بغرض التحديد وامراقبة: والتتبع.: والتنظيم» والتنبؤء والتوجيه 
(Clarke 1988: Raley 2013)‏ وتعمل مراقبة البيانات على تحويل الكميات الهائلة 
من الأفعال والأفكار التي تمثلها هذه البيانات إلى صورة واضحة ومقروءة ونماذج 
واضحة للحكم على الأشياء )359 :2004 (Curryet al.‏ وهي مكون أساسي من 
الأشكال الحديثة للحوكمة والحاكمية. وفيما يتعلق باستخدام البيانات» وكما ناقشنا 
في الفصل السابع» يتم استخدام البيانات من أجل توصيف واستهداف الأشخاص 
وذلك بهدف زيادة الأرباح. ومن ثم ففي غالب الأحيان يتم إعادة تحديد الغرض 
من البيانات واستخدامها في أغراض م تكن مقصودة على الإطلاق عند تكوين هذه 
البيانات» ومن ثم فإن مراقبة الآثار الرقمية والصور التخيلية للبيانات يثيران العديد 
من المخاوف الإضافية وخاصة فيما يتعلق بقضايا مثل الخصوصية. والتنميط والفرز 
الاجتماعي» وإقرار أساليب متعددة للحوكمة. 
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الخصوصية :(Privacy)‏ 
الخصوصية هي حالة يتوقعها ويقدرها الكثير من الناس» وهي تُعَدُ حقاً من حقوق 
الإنسان الأساسية. وهي من الحقوق المقدسة في الكثير من القوانين الوطنية والدولية. 
وف الولايات Bac ecl‏ فإن الخصوصية مغطاة بشكل كبير في القوانين المسماة قوانين 
الخصوصية: أما في الاتحاد الأوروبيء فهي تقع ضمن نطاقات قوانين حماية البيانات 
.(Minelli et al. 2013)‏ والخصوصية مصطلح متعدد الأبعاد فيما يتعلق بمعناه. وهو 
يستخدم في غالب الأحيان في طرق معتمدة على السياق» ولكن على وجه العموم هو 
يشير إلى الممارسات المقبولة فيما يتعلق بالوصول إلى والإفصاح عن ال معلومات الشخصية 
والحساسة )2011 .(Elwood and Leszczynski‏ ومن الوسائل ال مستخدمة في إيضاح 
الأبعاد المتعددة للخصوصية دراسة الوسائل العديدة التي يمكن من خلالها انتهاك 
الخصوصية والأضرار ا مرتبطة بهذه الانتهاكات» )2006 Solove‏ انظر الجدول رقم 10.1). 
فالذي يتضح UJ‏ من خلال هذا التصنيف هو أن انتهاك الخصوصية هكن أن يكون له 
العديد من التأثيرات على الرفاهية الحسدية والعاطفية للأفراد. ويجعل هؤلاء الأفراد 
عرضة للأنشطة المضرة التي يقوم بها VI‏ 05,5 ويجعلهم كذلك عرضة لاختلال توازن 

السلطات غير المتماثل. 

ويوجد بعض الشكوك Ob‏ مفهوم الخصوصية يتغير. وكما تمت الإشارة أعلاهء فإن الناس 
عرضة الآن لمستويات من الفحص والتدقيق وكذلك أساليب المراقبة أكثر من أي وقت مضى. 
فالمهام التي كانت تعد في الماضي خاصة إلى حد كبيرء يتم OI‏ مراقبتها وتسجيلها. على 
سبيل «JL‏ فإن البرامج التي كان يشاهدها الشخص على التلفاز لم تكن معروفة في الماضي 
إلا ممن هم حاضرون مع الشخص ذاته في الغرفة ذاتهاء في حين أنه يمكن لشركات التلفاز 
الآن مراقبة ما الذي يتم مشاهدته على كل تلفاز على حدة وذلك بسبب استبدال البث 
التلفزيوني وحيد الاتجاه بالتواصل ثنائي الاتجاه. وما يشتريه المرء كان في السابق معروفا 
للعميل والشخص الذي يخدم هذا العميل فحسب والآن أضحت هذه المعلومات التي يتم 
جمعها بشكل روتيني من خلال إدراج النقود الرقمية في عملية الدفع متاحة لشرائح أكبر. 
والأماكن التي كان يسافر إليها الفرد لم تكن سابقاً معروفة إلى حد كبير لأي شخص ما عدا 
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المسافرين ومرافقيهم» ولكن في الوقت الراهن أضحى العديد من الأنظمة تكشف موقع 
الشخص والطرق التي اجتازها كنظم الملاحة باستخدام الأقمار الصناعية (GPS)‏ الممثبتة 
في السيارات أو أجهزة الهواتف الخلوية ونظام تثليث الإشارات في أبراج شبكات الهاتف. 
وأنظمة النقل العام التي تعتمد على استخدام شريحة تحديد الهوية باستخدام موجات 
الراديو (RFID)‏ في أنظمة أو أكشاك دفع رسوم المرور. ومثل هذه البيانات التي تنتجها 
هذه الأنظمة يتم إعادة تجميعها ونشرها وبيعها. 


الجدول رقم )9 - )٠١‏ 


تصنيف الخصوصية 


جمع ال معلومات Information‏ 
Collection‏ تجواب الأشكال المتعددة من الاستجواب أو التقصي من أجل 
الحصول على ال معلومات 


الإهمال في حماية ال معلومات المخزنة من التسريبات 
والوصول إليها بطريقة غير ملائمة 
الاستخدام الثانوي | يتم استخدام ا معلومات التي تم تجميعها لغرض معين 


معالجة المخلومات l‏ 5 
à‏ اغراض 5,21( دون الحصول على موافقة الشخص 


Information Processing‏ موضوع البيانات 


الإخفاق في السماح للشخص موضوع البيانات 
بمعرفة البيانات التي يبمتلكها الآخرون عنه وا لمشاركة 
في معالجة واستخدام هذه البيانات» وهذا يشمل 
الإقصاء والمنع من التمتع بالمقدرة على الوصول إلى 
هذه البيانات وتصحيح الأخطاء الواردة فيها. 
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الكشف عن المعلومات عن شخص ما والتي تؤثر في 
الطرق التي يحكم بها الآخرون على شخصيته 
نشر المعلومات 


Information 


Dissemination 


استخدام هوية الشخص موضوع البيانات من أجل 


Pu‏ تدخل المتعلق | التدخل في قرارات الشخص موضوع البيانات التي 
Invasion‏ بالقرارات تتعلق بشئونه الخاصة. 





المصدر: تم تجميعه من )2006( -Solove‏ 

وعلاوة على ذلك» فنحن نعيش في عام أكثر انفتاحاً وشفافية بكثير عما اعتدنا عليه سابقا. 
فا معلومات التي كانت ds‏ خاصة في السابق يتم مشاركتها الآن بشكل أكثر حرية كالسير 
الذاتية من خلال موقع لينكد إن (LinkedIn)‏ والصور والفيديوهات العائلية من خلال 
مواقع فليكر (Flickr)‏ وإنستجرا ام (Instagram)‏ ويوتيوب (YouTube)‏ والقصص الشخصية 
والعائلية من خلال موقع فيسبوك (Facebook)‏ والمدونات, والأفكار وا معتقدات الشخصية 
من خلال تويتر (Twitter)‏ وغرف الدردشة والتعليقات على الإنترنت. فما كان يتم مشاركته 
في السابق مع عدد لا يتجاوز أصابع اليد الواحدة من الأشخاص كأفراد العائلةء والأصدقاء 
المقربينء وأرباب العمل في المنزل أو المقهى ال محاي أو مكتب للموارد البشرية يتم نشره الآن 
على المستوى العالمي مما يسمح لأي شخص بمشاهدته وتعديله )2013 „(Minelli et al.‏ 
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وعلى الرغم مما ذكر سابقاً لا يتصرف كل شخص بسهولة وبحرية فيما يتعلق ببياناته 
duari‏ حتى ولو كان الشخص يتصرف على هذا النحوء فإنه لا يتوقع بالضرورة أن هذه 
البيانات سوف يتم انتقاؤهاء ومعالجتهاء وتجميعهاء وبيعها. وهم لا يتوقعون أيضا أن 
تطبيقات البرامج التي لا يوجد بها أي عنصر من عناصر وسائل التواصل الاجتماعي» والتي 
يعتبرونها تطبيقات خاصة رها تقوم بتكوين ونقل البيانات إلى مطوري تلك التطبيقات» أو 
أن بعض الشركات ربما تحاول أن تقوم بالهندسة العكسية لإستراتيجيات حماية الخصوصية 
مثل إخفاء الهوية من أجل إنشاء ملفات شخصية dose‏ ومع ذلك. فإن هذا الأمر 
يحدث بانتظام. T‏ سبيل JULI‏ وجدت صحيفة وول ستريت جورنال Wall Street)‏ 
(journal‏ في اختبار أجري على 101 تطبيق للهواتف ASII‏ أن 56 AX‏ نقلت معرف 
الجهاز المتفرد للهاتف إلى شركات أخرى وذلك دون معرفة المستخدم أو الحصول على 
موافقته. وأن 47 تطبيقاً أرسلت موقع الهاتف» وأن 5 تطبيقات أرسلت البيانات الشخصية 
للمستخدمينء وأن 45 تطبيقاً لم يكن بها أي ارتباط مع سياسات حماية الخصوصية التي 
يمكن للمستخدمين مشاهدتها )2011 .(Efrati et al.‏ كما وجدت شركة الثقة الإلكترونية 
CTRUSTE)‏ ۹ فط مو أغان s i ٠۴۶١‏ مرسظوق سيامة toal‏ وأن متاح 
شركتي أبل وجوجل يشترطان ضرورة اشتمال التطبيقات على هذه السياسة Coterill)‏ 
2011(. ومع ذلك» وكما أشار )2011( Gralla et al‏ مكن للتطبيقات أن تتتبع وتنقل 
"عاداتك على الشبكة. وأن تبحث في قانئمة جهات الاتصال لديكء وأن تجري مكالمات 
هاتفية دون أن تعرفء وأن تتتبع موقعك. وأن تفحص ملفاتكء وغير ذلك الكثير". 

إن مشهد الخصوصية الآن في حالة تغير مستمرء وهو يخيب كلا من التوقعات القانونية 
والاجتماعية» وبالنسبة «yas‏ فإن مفهوم الخصوصية قد تعطل بشكل كبير Rambam)‏ 
Rübenking 2013‏ :2008). ويرى البعض أنه من الصعوبة بمكان المحافظة على الخصوصية 
في التطبيق العملي» كونها تحجب وتخفي تجربة المستخدم» وهي معوق اقتصاديء ولا يبدو 
أن معظم الناس يعارضون أن يتم التنقيب في بياناتهم, وإذا م يكن لديك شيء لتخفيهء فما 
المشكلة في أن يتم معرفة بياناتك؟ )2007 501076 :126 :2013 .(Raley‏ وبالنسبة للبعض 
الآخر» فإن الخصوصية حق يتعين حمايته لأنه من الحقوق التأسيسية ل "المواطنة المطلعة 
والمتأملة" وهو مكون أساسي أيضًا لحرية التعبير )2009 dis (Jes .(Cavoukian‏ يرى أن 
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الخصوصية "سمة ضرورية وتأسيسية للأنظمة السياسية الدهوقراطية المتحررة" Cohen)‏ 
2. فإذا تم إنكار الأشكال المتعددة من الخصوصية التي تم إيجازها في الجدول 
رقم »)٠١-١(‏ فإن الناس سيكونون عرضة لأنوع مختلفة من الأضرار الشخصية وأشكال 
الحوكمة الأكثر ضرراً. ويبدو أن جميع المعلقين يؤيدون وجهة النظر القائلة ol‏ تشريعات 
الخصوصية لم تعد dla‏ للغرض التي شرعت من alel‏ وأنه يتعين تحديث تلك التشريعات 
لكي تلائم الأوقات التي نعيشها الآن. 
الجدول رقم )٠١ - Y)‏ 
مبادئ الممارسة العادلة للمعلومات 


Ta 


الإخطار (Notice)‏ يتم إخطار الأفراد ob‏ بياناتهم يتم إنشاؤها ويتم إعلامهم بالغرض 
الذي سيتم استخدام هذه البيانات فيه 


الاختيار (Choice)‏ يتمتع الأفراد بحرية اختيار اممشاركة أو يؤثرون عدم امشاركة وذلك 
فيما يتعلق ما إذا كانوا يرغبون في استخدام بياناتهم أو الإفصاح 
عنها وكيفية القيام بذلك 


ا موافقة (Consent)‏ || يتم إنشاء البيانات والإفصاح عنها فحسب بعد موافقة الأفراد 


الأمن (Security)‏ يتم حماية البيانات من الفقد» وإساءة الاستخدام» والوصول غير 
المصرح ds‏ والإفصاح dgis‏ وتعديلها أو تدميرها. 


5 (Integrity) التكامل‎ 


منها 


ا مساءلة (Accountability)‏ | يكون مقتني البيانات مسئولا عن ضمان تحقق المبادئ السابق 
ذكرها وأن يكون لديه الوسائل اللازمة من أجل ضمان الالتزام بهذه 
ICM‏ 





-(Minelli et al. (2013: 156 المصدر:‎ 
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الجدول رقم )٠١ - Y)‏ 
أنواع المعلومات المحمية 


المعلومات الشخصية ال معرفة | ا معلومات الحساسة: هي أي | المعلومات الأخرى التي هكن 
(811): هي أي معلومات تعرف | معلومات aue‏ للكشف غير | استخدامها لتخمين هوية شخص 
شخصضا ما بصورة مباشرة أو غير | اللصرح لها أن يسبب الإعراج أو | ها 

شرة الضرر لشخص ما 


ET 


العنوان البريدي / الرمز البريدي | الآراء السياسية هوية ملف تعريف الارتباط 
(cookie)‏ 


سس ل 


ف اساد اماي aa]‏ | 


الجنسية 
اماس سوي اس ا 





.(Minelli et al. (2013: 159 المصدر: مقتبس من‎ 


às‏ الوقت «al JI‏ فإن تشريعات الخصوصية مبنية حول الحقوق الشخصية وامموافقة 
المتعلقة بإنشاء واستخدام» والإفصاح عن البيانات الشخصية )2013 .(Solove‏ وهي تتكون 
من سبعة مبادئ عالمية للخصوصية )156 :2013( Minelli et al.‏ (انظر الجدول رقم ۰-۲( 
dis‏ إطار هذه المبادئ» فإن الأفرادء من الناحية النظرية» يتم منحهم الحق للتحكم في بياناتهم 
الشخصية ومنح موافقتهم للآخرين فيما يتعلق بهذه البيانات. وعلاوة على ذلك فإنه يتعين على 
مقتنيي البيانات الالتزام بقوانين حماية البيانات التي تقيد الإفصاح عن المعلومات الشخصية 
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امعرفة «(Personally Identifiable Information- PIT)‏ وامعلومات الحساسة» والبيانات 
الأخرى التي يمكن استخدامها للاستدلال على الشخصية (انظر الجدول رقم »)٠١-۳‏ وتؤيد تقليص 
البيانات بحيث يقتصر إنشاء البيانات على البيانات الضرورية لتحقيق غرض معين Tene and)‏ 
.(Polonetsky 2012‏ وعلى وجه العموم فإن الحل لاشتراطات المعلومات الشخصية المعرفة 
(PII)‏ هو استخدام أساليب إخفاء الهوية مثل عدم تحديد الهوية (إخفاء المعلومات الشخصية 
المعرفة)» والأسماء المستعارة» والتجميع, بالإضافة إلى التشفيرء والتخزين الآمنء والقيود الخاصة 
بالوصول إلى المعلومات )2011 .(Coterill‏ 

وأخيرا تجدر الإشارة إلى وجود العديد من المشاكل الإدراكية والبنيوية المرتبطة 
بتشريعات الخصوصية الحالية. 

وتحاول الدول بصورة روتينية التحايل على قوانين الخصوصية وذلك من أجل أغراض 
الأمن garg‏ المعلومات الاستخباراتيةء بحسب ما تم الكشف عنه مؤخرا بواسطة برامج 
تحليل وجمع البيانات السرية في الولايات المتحدة الأمريكية, والمملكة المتحدة والعديد من 
الحكومات الأخرى (انظر الفصل السابع). كما أن الكثير من الشركات لا تشعر بأنها مجبرة 
على تقديم سياسة الخصوصية للأفراد وذلك لأن هذه الشركات تدعي أنها تجمع معلومات 
مجهولة المصدرء ومن ثم فهي لا تقع تحت طائلة ممارسات المعلومات العادلة. أو رها 
تقدم هذه الشركات سياسة الخصوصية, وذلك عند الاستهلال الأولي للالتزامات (على سبيل 
المثالء عند تثبيت برنامج ما أو الاشتراك في خدمة ما) وتكون هذه السياسة مصاغة بلغة 
معقدة وغامضة» وعادة ما تشتمل على الاحتفاظ بالحق في تعديل هذه السياسة في وقت 
لاحق دون تشاور إضافي مع الشخص )2013 (Rubinstein‏ 

وفيما يتعلق بالبيانات التي تم تكوينها بدون معرفة الشخص., فمن الصعوبة بمكان 
اكتشاف Jio‏ هذه الممارسات ومواجهتها من الناحية القانونية. أما في حالة الخصوصية 
ذات الإدارة الذاتية. وكما شرح )2013( Solove‏ فهي ببساطة مرهقة للغاية وبالغة 
الصعوبة على الأفراد كونها تتطلب قيامهم بتنظيم خصوصيتهم عبر الكثير من الكيانات, 
وا موازنة بين التكاليف وامنافع المرتبطة با موافقة على الشروط والبنود دون معرفة كيف 
سيتم استخدام هذه البيانات في الوقت الحالي وف المستقبلء وأيضا تقييم التأثيرات الشاملة 
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والتراكمية لبياناتهم التي سيتم دمجها مع مجموعات البيانات الأخرى. وبناء على ذلك 
أشار (2013) 501076 إلى أن: 
)1( الناس لا يقرؤون سياسات الخصوصية؛ )2( إذا قرا الناس سياسة الخصوصية 
فإنهم لا يفهمونها؛ )3( إذا قرأ الناس سياسة الخصوصية وفهموهاء فإنهم في الغالب 
يفتقدون الخلفية الكافية لاتخاذ اختيار مبني على المعرفة؛ (4) وإذا قرأ الناس سياسة 
الخصوصية وفهموها. وكان بإمكانهم اتخاذ اختيار واع ومبني على المعرفة, OB‏ 
اختيارهم ممكن أن ينحرف وذلك من جراء العديد من الصعوبات المرتبطة باتخاذ 
القرار )1888 :2013 .(Solove‏ 
ومن ثم فإن الموافقة تكون في غالب الأحيان ممارسة عديمة الجدوى Rubenstein)‏ 
2 »2 وذلك عندما يقوم الأفراد عن غير قصد بالتخلي عن الحقوق دون إدراك ممدى أو 
عواقب الفعل الذي يقومون به. ومن ثم» فإن سياسات الخصوصية في غالب الأحيان تخدم 
إخلاء المسئولية للشركات بصورة أكبر مما تخدم عملية ضمان الخصوصية للمستهلكينء 
.(Tens and Polonestky 2012)‏ وعلاوة على ذلك. فمن الواضح أنه في عصر البيانات 
الكبيرة» فإن إستراتيجية إزالة التعرف على الأشخاص توفر شكلاً ضعيفاً فحسب من أشكال 
الخصوصية لأن من الممكن القيام بالهندسة العكسية للعملية وذلك من خلال التنقيب في 
مجموعات البيانات وتجميعها )2010 .(Narayanan and Shmatikov‏ فعلى سبيل «JULI‏ 
يشرح نيف سينحر (Niv Singer)‏ من شركة تراكسك (Traxc)‏ (والمقتبس في Minelli et‏ 
(al. 2013: 1‏ عملية إزالة التعرف على الأشخاص كما يلي: 
يمكن في بعض الأحيان أن يكون من الصعوبة بمكان توحيد SAI‏ الشخصية 
الاجتماعية المستخدم واحد والذي رها يستخدم العديد من الأسماء أو تعاملات 
مختلفة في كل واحدة من شبكات التواصل الاجتماعي» ولذا فلقد قمنا ببناء 
خوارزميات تقوم بالتنقيب في العوامل الأساسية التي تشتمل على محتوى 
المشاركات وامموقع على سبيل JEL‏ لا الحصرء وذلك من أجل توفير توحيد للهوية 
بشكل فعال إلى درجة كبيرة. 
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ونتيجة لهذه المخاوف. يدرس الاتحاد الأوروبي منذ فترة سياسات حماية البيانات (انظر 
المفوضية الأوروبية ;2011 European Commission 2012. Hon et al. 2011; Koops‏ 
(Rubinstein 2013‏ وتشتمل اقتراحات الاتحاد الأوروبي على أن تكون الموافقة صريحة 
وليست ضمنية أو مفترضة» وأن يكون وصول الأفراد إلى البيانات الخاصة بهم شيل cass‏ 
وأن يكون للأفراد الحق في قابلية النقل للبيانات بمعنى المقدرة على نقل البيانات الشخصية 
من مزود خدمة إلى مزود آخرء والحق في أن يتم نسيان الشخص» حيث هكن للأفراد أن 
يطلبوا حذف بياناتهم إذا م تكن هناك أي أسس مشروعة للاحتفاظ بهذه البيانات» وأن 
تنطبق هذه القواعد أيضا على الشركات خارج الاتحاد الأوروبي إذا كانت هذه الشركات عاملة 
في سوق الاتحاد الأوروبي وتقدم خدماتها ممواطني دول الاتحاد الأوروبي )2012 European‏ 
(Commission‏ وباطمشل» تقدمت مفوضية التجارة الفيدرالية في الولايات المتحدة 
الأمريكية باقتراح يتضمن ثلاثة تعديلات من أجل توفير حماية أكثر فعالية للخصوصية: 
الخصوصية من خلال التصميم حيث يتم تأسيس الخصوصية بشكل متأصل في كل مرحلة 
من مراحل تطوير المنتج؛ منح الشركات وال مستهلكين خيار مبسط هنحهم المقدرة على 
اتخاذ القرارات بشأن بياناتهم الخاصة» وهذا يشمل تطبيق آلية لعدم التتبع والحصول على 
الموافقة الصريحة فيما يتعلق بالبيانات الحساسة» أو الحصول على موافقة قبل استخدام 
البيانات في غرض مختلف بشكل مادي عن الغرض الذي تم من أجله تكوين هذه البيانات؛ 
وشفافية أكثر فيما يتعلق بالبيانات وجمعها واستخدامهاء وهذا يشمل الوصول المعقول 
إلى البيانات من قبل هؤلاء الذين تمثلهم تلك البيانات. مع منحهم المقدرة على تصحيح 
أو حذف البيانات (مفوضية التجارة الفيدرالية 2012 (Federal Trade Commission‏ 
وتنشد إستراتيجية الخصوصية من خلال التصميم تطبيق إستراتيجية مختلفة عن الالتزام 
التشريعي والتنظيمي» وهي تقترح أن تكون الخصوصية هي الوضع الافتراضي للعملية؛ 
أي نظام يسعى بفعالية وبوضوح إلى ضمان الخصوصية )2009 .(Cavoukian‏ ومن شأن 
المبادئ السبعة المذكورة في الجدول رقم )€ - )٠١‏ أن تعزز هذا المنهج. 
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الجدول رقم )€ - )٠١‏ 


ا مبادئ السبعة الأساسية للخصوصية من خلال التصميم 


استباقية وليست تفاعلية؛ | ينبغي أن تسعى نظم تكنولوجيا المعلومات لتوقع الخصوصية 


الوقاية وليس العلاج تحديد ا مخاوف المتعلقة بالخصوصية وتجنبها بدلاً من السعي 
إلى حل المشاكل الناتجة عن مخالفات الخصوصية بعد حدوثها 


الخصوصية هي الوضع الافتراضي | الخصوصية محمية تلقائيا ولا تتطلب أي عمل من جانب الأفراد 


الخصوصية مدمجة في التصميم | حماية الخصوصية هي سمة أساسية للتصميم والهندسة الهيكلية 
لأنظمة تقنية المعلومات وليست ميزة إضافية متدنية الأهمية 


الفعالية الكاملة - عائد إيجابي | جميع المصالح والأهداف المشروعة يتم استيعابهاء بدلا من أن 
وليس محصلة صفرية يكون هناك مقايضات بين الخصوصية واعتبارات أخرى مثل الأمن 
الأمن من النهاية للنهاية-حماية | تكون الخصوصية جزءًا لا يتجزأ من النظام من بداية إطلاقه إلى 
كاملة طوال دورة حياة النظام | حين التخلص منه 
الوضوح والشفافية - فلتكن | تكون جميع الأجزاء المكونة للنظام وعملياته واضحة وشفافة 
مفتوحة على الدوام للمستخدمين والشركات الموفرة على السواء وتخضع لتدقيق مستقل 
احترام خصوصية المستخدم - أي | يجب أن يبنى النظام حول الأفراد» وأن يحمي مصالحهم» وأن 
جعلها تتمحور حول ا مستخدم | يكون مُمكنًا لهم 
ا مصدر: )2009 .(Cavoukian‏ 





لقد اقترح العديد من العلماء ا متخصصين في الخصوصية وأيضًا العديد من مجموعات 
الضغط الصناعية مناهج متعددة لكيفية التعامل مع قضية الخصوصية:. فالعلماء 
المختصون موضوع الخصوصية سبق لهم التطرق للمواضع التالية: الإصلاح التشريعي 
ا مصمم من أجل حماية حقوق المواطنينء والذي يشمل بعض القضايا كالحق في الصفحة 
البيضاء وتواريخ الانتهاء للبيانات )2011 (Koops‏ ومن الذي يكون مسئولاً عن ضمان 
الخصوصية: المطورون el‏ الوكالات el‏ المستخدمونء وعن الوسائل التقنية والإدارية 
لتنفيذ هذه الأمور )2011 .(Coterill‏ وما الذي يشكل المعلومات الخاصة وكيفية تأطير 
القصوصية حدول | sels‏ ومدق الخ ويد من تا طرها حول ترف Heti) isl‏ 
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(etal. 1‏ واقترح هؤلاء العلماء أيضًا دخول الأفراد في شراكات مع المطورين حيث 
يكون بإمكانهم أن يختاروا بشكل أكثر استباقية ما البيانات التي يرغبون في نشرهاء 
ولمن تنشر هذه البيانات» وتحت أي ظروف تنشر هذه البيانات. كما اقترحوا أن تتيح 
الشركات للمستخدمين الوصول إلى بياناتهم الشخصية بصيغة قابلة للاستخدام وذلك من 
أجل مصلحتهم الشخصية. وأخيراء اقترحوا أن تقوم الشركات بمشاركة الثروات الناتجة 
عن تحويل البيانات الشخصية إلى أموال Tene and Polonetsky 2012; Rubinstein)‏ 
3. وكمثال على هذه المشاركة المفيدة لكلا الطرفين في الثروات المتحصلة من بيع 
بيانات الشبكات الذكية حيث يتم استخدام البيانات التي تم تكوينها من خلال العدادات 
الذكية والمتعلقة باستهلاك أفراد الأسرة للكهرباء من قبل شركة الكهرباء من أجل ضمان 
كفاءة التزويد بالكهرباء. ويتم مع ذلك توفير تطبيقات لأفراد الأسرة لتمكينهم من مراقبة 
استخدامهم الشخصي وأن يعدلوا سلوكياتهم من أجل توفير JUI‏ إن سوق الصناعة, إلى حد 
كبير» يريد إما الاستمرار في الإمدادات الحالية على ما هي عليه أو تقليل هذه الإمداداتء 
مع إدارة الخصوصية من خلال تنظيم يقود السوق ولا يكبح الاستفادة الاقتصادية من 
البيانات. وفي هذه الحالة» فمن المتصور أن الشركات سوف تقوم بعملية التنظيم الذاتي 
خشية حدوث أضرار بسمعة تلك الشركات أو أن يعبر عملاء الشركات عن عدم رضاهم من 
خلال عدم التعامل مع هذه الشركات إذا انتهكت هذه الشركات خصوصية هؤلاء العملاء 
بشكل مبالغ فيه )2013 (Minelli et al. 2013; Mayer-Schonberger and Cukier‏ 


أمن البيانات :(Data Security)‏ 
مع وضع قيمة البيانات في الاعتبارء وخاصة البيانات الشخصية التي يمكنها أن تسهل 
سرقة الهويةء أو البيانات التجارية التي يمكن قرصنتها أو استخدامها من أجل تحقيق ميزة 
تنافسية» أصبح أمن Lals Via oL]‏ في حماية البيانات. فالأفراد يممكنهم فتح العديد 
من الحسابات سواءٌ الحسابات الشخصية أو حسابات العملء مع العديد من الهيئات 
والبائعين وذلك باستخدام العديد من رموز الهوية الشخصية وأسماء ال مستخدمين وكلمات 
السر. فالبيانات المتعلقة بهؤلاء الأفراد. والبيانات الشخصية الخاصة بهم» يتم تخزينها في 
الكثير من الأماكن (على سبيل JULI‏ أجهزة الحاسب الآلي» والأجهزة الرقمية» والهواتف 
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USB) Jis ومحركات الأقراص الصلبة الخارجيةء وأجهزة تخزين البيانات المتنقلة‎ ASII 
والخوادم. وتكون هذه الحسابات والأجهزة الرقمية عرضة للقرصنة (الدخول على‎ )21 
الحسابات أو الوصول إلى الأجهزة)» والبرمجيات الخبيثة (الرموز التي يتم تثبيتها بشكل‎ 
سري على جهاز الحاسب والتي يمكنها الوصول إلى امعلومات الحساسة أو تسجيل ضغطات‎ 
(الرسائل‎ (Phishing) لوحة المفاتيح وترسل هذه الأشياء إلى طرف ثالث). والانتحال‎ 
الإلكترونية الاحتيالية أو الهندسة الاجتماعية من خلال المكالمات الهاتفية التي تحاول أن‎ 
تجعل الشخص يتطوع بتقديم معلومات حسابه)» مما يؤدي إلى سرقة واختلاس البيانات.‎ 

وقد ناقش 2011( (Gantz and Reinsel‏ بالتفصيل خمسة مستويات لأمن البيانات» 
وكل مستوى من هذه المستويات له محركات مختلفة إلى حد ماء وذلك على الرغم من أن 


التالي: 

(Y)‏ الخصوصية: من أجل المحافظة على المعلومات وتقييد تداولها. 

(Y)‏ الامتثال والالتزام: من أجل حماية البيانات التي من المحتمل أن تكون قابلة للكشف 
عند التقاضيء أو الخاضعة لشروط الاستبقاء. 

(Y)‏ الاحتراز: من أجل حماية البيانات التي يمكنها أن تؤدي إلى أو تساعد على سرقة الهوية. 

)€( السرية: من أجل التأكد من حماية المعلومات السرية مثل الأسرار التجارية. 

)0( التأمينء من أجل حماية المعلومات عالية السرية مثل الصفقات التجاريةء والملفات 


الشخصية. والسجلات الطبيةء وا معلومات da S asl‏ التي يمكن أن يكون لها تأثير 

يتجاوز السرقة الشخصية. l‏ 

Ass‏ اذاق المسعويات الخمسة السايقة لأمن daga coU‏ بالغة الأهمية «النسية للأقراد 
والشركات وا مؤسسات. وعلى وجه العموم» يتم إنجاز هذه المهمة من خلال التحكم في الوصول 
عبر برامج الأمن وتصميم النظام / الشبكات ue)‏ سبيل JULI‏ تثبيت جدار ناري وبرامج 
لاكتشاف ومكافحة الفيروسات» والرسائل غير ا مرغوب فيهاء وحصان Slab‏ والبرمجيات 
الخبيثة). والتشفير الذي يتطلب كلمة سر لفتح الملفات المغلقة. وإذا وضعنا في الاعتبار أنه 
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بمجرد أن يتم الوصول إلى البيانات فسوف يصبح من السهل نسخها ونشرهاء فإن إدارة الحقوق 
الرقمية تسعى لتقييد Jio‏ هذه الممارسات وأن تجعل من السهل أيضا تتبع تلك الممارسات. 


ومع «US‏ وعلى الرغم من هذه التهديدات» فإن الأجهزة الرقمية والخدمات والبيانات» 
ونقاط الضعف المحتملة في تهيئتهم: تزيد بسرعة أكبر من المقدرة على تأمينهم Gantz)‏ 
às .(and Reinsel 2011‏ حين أن الكثير من أجهزة الحاسب الشخصية وأجهزة الحاسب 
ا محمولة dial‏ بصورة نسبية مادامت برامج الحماية الخاصة بها تحدّث بشكل 5099« 
إلا أن أجهزة الحاسب اللوحية: والهواتف ال محمولةء وأجهزة الفاكسء ومحركات الأقراص 
الصلبة الخارجية» والأجهزة الطرفية (مثل الطابعات. وأجهزة المسح fgl‏ وآلات تصوير 
المستندات الشبكية). والعدد الهائل من الأجهزة التي تشكل إنترنت الأشياء عادة ما تتمتع 
بحماية قليلة )2013 .(Rezendes and Stephenson 2013; Rose‏ وقد أدى ذلك ب 
(Mims (2013‏ إلى الادعاء بأنه مجرد وجود أي شيء في بيئة تشتمل على رمز رقمي ويتم 
توصيله بالشبكة» فيمكن قرصنة هذا الشيء من خلال كائنات يحتمل أن يتم التحكم بها 
عن بعد أو يتم إجبار ذلك الشيء على تجاوز معايير التصميم» أو العمل بطرق غير مريحة 
أو خطرةء أو يضلل المستخدمين مما يؤدي إلى حدوث الأخطاء والأضرارء أو يتجسس على 
الساكنين أو المستخدمين. وعلاوة على ذلك» فإن الطرق المستخدمة من قبل القراصنة أو 
امحتالين أصبحت أكثر تعقيداً وعدوانية عن السابقء وأن صناعة الأمن lags‏ في سباق من 
أجل مواكبة هؤلاء القراصنة والمحتالين )2012 (Goldberg‏ 

فمع تطور ثورة البيانات» ووفرة المزيد من الأجهزة التي «Joly qui‏ وتستخدم 
البيانات» يبدو أن القضايا والمخاوف الأمنية معرضة للازدياد وليس التقلص Gantz et al.)‏ 
7). وهذا بدوره سيؤدي إلى تفاقم الجرائم مثل سرقة «do gall‏ وتقوض الثقة في نظم 
البيانات» ورفع سلسلة من المسائل القانونية المتعلقة بالمسؤولية والالتزامات تجاه حماية 
النظم عندما يتم العبث بالبيانات» واختلاسها وسرقتها )2010 (Weber‏ 
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Profiling, Social) التشخيص. والتصنيف الاجتماعي والخطوط الحمراء‎ 
:(Sorting and Redlining 

بعيداً عن توسيع محيط المراقبةء وانتهاك dogas‏ ونقاط الضعف المتعلقة بأمن 
البيانات» تأني المخاوف بشأن ماهية المجالات التي يتم فيها توظيف فيضان البيانات لتحقيق 
أشياء معينة. وكما أشرنا إلى ذلك في الفصل السابع» م تتغير طبيعة البيانات فحسبء ولكن 
يوجد أيضا تحول نوعي في الكيفية التي يتم بها تحليل البيانات» وفي أي الغايات يمكن 
استخدام البيانات وتحليلات البيانات. ومن لديه السلطة لاستخدام واستخلاص القيمة من 
البيانات. فالبيانات كانت تستخدم لوقت طويل من أجل تنميط وتقسيم وإدارة السكانء 
ولكن هذه العمليات أصبحت في الوقت الراهن أكثر تعقيداء ودقة. Healy‏ وانتظاما 
عن ذي قبل بكثير. وفي حين أن الهيئات الحكومية تكون ملفات شخصية للأفراد وذلك 
من أجل أغراض الأمن ورصد الاحتيالء إلا أن معظم النمو في عملية التنميط يتم من قبل 
الشركات التجارية والتي تسعى إلى فهم واستهداف قاعدة المستهلكين الحالية وا محتملة 
(انظر الفصل الثاني). 

ففي الماضيء كانت الشركات تقوم بالتسويق الجماعي» ونشر رسالة عامة إلى حد ما 
hwg‏ مجموعة كبيرة جدا من الجمهور وذلك من خلال الإعلان الجماعي باستخدام التلفاز 
والراديوء والطباعة» والبريد الإلكتروني» وذلك من أجل الوصول إلى المجموعة المستهدفة 
لتلك الشركات )2011 (Schwartz and Solove‏ وبمرور الوقت. تم تعزيز هذا الأمر 
من خلال التسويق المستهدف وذلك باستخدام التنميط الخام بشكل نسبي. وهناء قامت 
مجموعة صغيرة من الشركات ال متخصصة بتكوين تصنيفات عامة للسكان حيث تم تصنيف 
الأسر إلى أصناف ذات ملفات شخصية عامةء والتي كانت في العادة يتم تسميتها من خلال 
اختيار متغيرات ومواقع دهوغرافية» على سبيل المثال باستخدام بيانات الإحصاء السكاني 
أو البيانات التي تعكس أسلوب الحياة كاستخدام بيانات الاشتراكات في دوريات معينة 
على سبيل المثال )1995 (Goss‏ وبدلاً من محاولة تنميط عملائهم الشخصيينء ترغب 
الشركات في شراء الملفات الشخصية وبيانات الاتصال وذلك من أجل تقسيم واستهداف 
أصناف معينة من السكان من خلال رسالة مؤطرة بدقة» وف الوقت نفسه تحقيق الفعالية 


ثورة البيانات البيانات الكبيرة» والبيانات المفتوحة, والبنى التحتية للبيانات» والنتائج المترتبة عنها yag‏ 


الفصل العاشر 


في ميزانية التسويق من خلال تقليل مصروفات الإعلانات المبددة. وف الآونة الأخيرة, 
بدأت شركات التنميط في إنشاء ملفات شخصية فردية بدلا من المافات الشخصية العامة 
وذلك من خلال تجميع البيانات من مصادر عدة مثل معاملات البطاقات الائتمانية 
ومعاملات بطاقات المتاجر» ومسارات النقرء والمشاركات في وسائل التواصل الاجتماعي» 
والعديد من أنواع البيانات الشخصية الأخرى )2013 ©5168). وعلاوة على CUS‏ تستفيد 
الشركات ذاتها من الكميات الهائلة من البيانات التي تنشئها عن العملاء على سبيل المثال» 
من خلال المطبيعات ومسارات النقر وإدارة علاقات العملاء وتجميع هذه البيانات مع 
المصادر الأخرى للبيانات وذلك من أجل تكوين الملفات الشخصية الخاصة بهم والاشتراك 
في التسويق السلوي. 

هنا من الناحية الظاهريةء يبدو أن التنميط التنبئي موقف مربح للجميع» للعملاء 
والبائعينء فالعملاء يحصلون على معاملة شخصية ومخصصة. في حين يحصل البائعون على 
مبيعات أكثر ويقللون من النفقات. ولكن وف المقابلء فإنه هكن استخدام التنميط التنبئي 
من أجل تصنيف الناس من الناحية الاجتماعية واستبعاد فئات منهم من خلال اختيار 
أصناف معينة منهم للحصول على وضع تفضيلي وتهميش واستبعاد الآخرين Graham)‏ 
Leyshon and Thrift 1999‏ ; 2005). فعلى سبيل «JULI‏ مکن للشركة تنميط الناس فيما 
يتعلق بمخاطرهم الائتمانية وما هي احتمالية مقدرتهم على الوفاء بسداد مدفوعاتهم» أو 
فيما يتعلق بقيمة حياتهم المتوقعة إذا ما ظلوا في برنامج الولاءء وما هي احتمالية تغييرهم 
لعاداتهم )2013 .(Minelli et al.‏ ومن خلال استخدام مثل هذه ال ملفات الشخصية 
والتنميطء يمكن للشركات تحديد الأولويات لاهتماماتهم ومواردهم» وذلك يتم عادة من 
خلال التركيز على العملاء ذوي القيمة العالية. ومن ثم يتم قياس وتصنيف العملاء بشكل 
منتظم ويحصلون على خدمات تفضيليةء وبعضها يكون تمييزياً مثل استبعاد السكان الذين 
ogis‏ بلا فائدة (لن يحققوا مكاسب للشركة)» أو لن يحققوا مكاسب ASS‏ أو أن المخاطر 
ا مرتبطة بهم عالية» مما هكن أن يؤثر بدوره على الفرص الحياتية Curry 1997; Danna)‏ 
.(and Gandy 2002: Wyly in press‏ فهذه الملفات الشخصية تعتبر منتجات ويمكن 
بيعها لشركات أخرى 0959 مهتمة في تقييم قيمة ومخاطر العملاء المحتملينء ومن ثم فإن 
النتائج السلبية يمكنها أن تطال الشخص عبر الأماكن وعبر الأزمنة. 
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ومثل هذه الممارسات التمييزية يمكن أن تشتمل على تسعير فعال وشخصيء فمن الأمور 
الشائعة بالفعل في سلاسل المتاجر أن تكون السلعة ذاتها مسعرة بطرق مختلفة عبر المتاجر 
المختلفة وذلك استناداً إلى خصائص وسمات السكان الذين يتسوقون من هذه المتاجن أو 
أن ذكون بعر اجات مخعلفا وفق الكمية المشتراة Sta)‏ المنتج الواحد بدولار في حين أن 
aas cols NT‏ أو أن A Gs xac cod‏ الاعات )3652 حضول الطلاف 
أو ا مواطنين الكبار في السن على تخفيضات) )1996 (Varian‏ وتتمثل رغبة الكثير من 
الشركات في تداول مثل هذه الممارسات على أسس فردية» ومعدلة لكي تناسب ال ملفات 
الشخصية. وذلك حتى يدفع أناس مختلفون أسعار مختلفة للمنتج ذاته (كما هي الحال 
مع أسعار تذاكر الطيران ولكن Lo‏ على نموذج مخصص). وتراوح الأسعار أيضًا بشكل فعال 
ووفق السياقء بناء على الظروف. وقد بدا بالفعل تطبيق مثل هذه الممارسات الشخصية 
والمرنة» ا في ذلك قطاع المتاجر. فعلى سبيل «JULI‏ تطرق )2012( Clifford‏ إلى أمثلة تبين 
أن المتسوقين يدفعون في المتجر ذاته أسعار مختلفة للمنتج ذاته وذلك استناداً إلى ملف 
العميل الشخصي. وفي بعض الحالات» تقوم المتاجر بتعديل الأسعار وقت تسوق العملاء 
وذلك sLo‏ على موقعهم داخل المتجر وتاريخ التسوق لهؤلاء العملاء حيث يتم منح القسائم 
الإلكترونية في ال موقع عندما يقوم المتسوقون مسح المنتج باستخدام التطبيقات في هواتفهم 
الخلوية. إن الهدف من وراء التسعير الشخصي والفعال هو الحصول على كامل فائض 
القيمة المتاح في المعاملة وذلك من خلال تسعير البضائع والخدمات لأقرب سعر ممكن 
من السعر الاحتياطي (سعر التحفظ) لدى الفرد (17 :2012 «Tene and Polonetsky‏ 
وبعبارة أخرىء فإن هذا مصمم للاستفادة من الإنفاق JULI‏ لمصلحة المتجر. 

وبالنظر إلى قدرتهم على تشكيل وتصنيف خبرات ال مستهلكين والفرص الحياتيةء OB‏ 
الملفات الشخصية للأفراد والبيانات وممارسات البيانات التي تدعمها بحاجة إلى اهتمام أكبر. 
وفي الوقت الحاليء فإن كلا من البيانات المستخدمة والتحليلات المطبقة مبهمة وغامضة 
بالنسبة للمستهلكين والمواطنين, فإذا انتهى الأمر بالشخص مدرجاً على قائمة الممنوعينء أو 
تم معاملته بشكل سلبيء أو تم استبعاده من منتج ما من قبل شركة ماء على سبيل المثال تم 
وضعه في القائمة السوداء للحصول على الائتمان» فمن الصعوبة os‏ تحديد الأسس لهذا 
التمييز ومجابهة هذه الأسباب. فالنقاد يدعون بأننا قد ولجنا Dem‏ حيث: 
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رما يتراءى للبعض أن لبنية البيانات أو الصورة التخيلية للبيانات ميزة وجودية» ولكنها 
std‏ ؤاض خيزة ages‏ إن Us‏ تقول abluo ons‏ فيك ]35 Boos dote‏ مها تراه 
أنت عن نفسك. فبنية البيانات هي البنية التي تم الحكم عليك من خلالها في المجتمعء 
وهي البنية التي تماي وتفرض وضعك في العام فما نشاهده عند هذه الفترة من الزمن هو 
غلبة التمثيل على الكينونة )1995 (Critical Art Ensemble‏ 

وعلى الرغم من ذلك فنحن نعرف أن البيانات الكبيرة وبنية البيانات فوضويان - فهما 
ممتلئان بالثغرات» والمتناقضات والأخطاء (انظر الفصل التاسع) - ونعرف أيضا أن البرامج 
والخوارزميات تعمل بطرق انتقائية ومتحيزة )2011 .(Kitchin and Dodge‏ ومن ثم 
فإن الأنظمة التي تعتمد على البيانات الكبيرةء والتي لا تعد شفافة وتفتقد إلى التدقيق 
اللازم وحق الرجوع الملائم» تطرح جميع الأنواع ا محتملة من المشاكل وذلك عندما يمنحون 
الأفضلية لبنية البيانات. وفي الواقع» فإن الوقت أصبح ملاماً الآن أكثر من أي وقت مضى 
للرقابة القانونية والتنظيمية على التنميط التنبئي» وعلى الإجراءات التي تشوش على التمييز 
الوجودي للبيانات وتحمي الناس من الممارسات التمييزية والضارة. 


Secondary Uses) الاستخدامات الثانوية والتحكم في الانسلال والحوكمة الاستباقية‎ 
.(Control Creep and Anticipatory Governance 

إن أحد الأسس التي تستند إليها سياسة الخصوصية وحماية البيانات في الاتحاد الأوروبي 
وأمريكا الشمالية هو مفهوم تقليص البيانات. وهذا ال مفهوم يشترط أن تقوم الهيئات 
والبائعون بإيجاد البيانات الضرورية فحسب لأداء مهمة ماء معنى أن يتم الاحتفاظ 
بالبيانات Ub‏ كان ذلك ضروريا لأداء هذه المهمة أو كما تمليه الاعتبارات القانونيةء وأن 
البيانات التي يتم تكوينها يتعين استخدامها فحسب من أجل هذه المهمة Tene and)‏ 
.(Polonetsky 2012‏ ومعنى آخر لا يتعين على جامعي البيانات أن يستولوا على أي شيء 
يمكنهم الاستيلاء عليه» ولا يتعين عليهم EUIS‏ تخزين هذه البيانات ممدة غير محدودة أو 
أن يتيحوا هذه البيانات لاستخدامات ثانوية. ومن الواضح أن هذه التطلعات والطموحات 
تتعارض مع المبادئ والأسس المنطقية للبيانات الكبيرة وعمل أسواق البيانات التي تسعى إلى 
تكديس البيانات في حال كان من ال ممكن أن تكتسب هذه البيانات أي قيمة في المستقبلء 
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.(Tene and Polonetsky 2012; Andrejevic 2013)‏ فالحل أمام البائعين تمثل في إعادة 
تقديم البيانات من خلال إزالة الأجزاء التي تشير لهوية الأفراد من هذه البيانات أو إنشاء 
بيانات مشتقة. مع إخضاع مجموعة البيانات الأساسية فقط لعملية تقليص البيانات. ويمكن 
في هذه الحالة بيع البيانات امعاد تقدهها أو استخدامها بعدة طرق» ومثل هذا الأسلوب 
لإعادة تحديد الغرض من البيانات أمر شائع» حيث يجادل البائعون أنه لا توجد حاجة 
لإبلاغ الشخص الذي تشر إليه البيانات أو الحصول على موافقته» حيث إن هذه البيانات 
مجهولة المصدر.ء ومشتقة ومجمعة )2007 .(Solove‏ وهذا الحصاد ال محتمل للكميات 
الهائلة من البيانات» والذي تم الحصول على معظمه دون معرفة أو فهم الأشخاصء والذي 
يتم استخدامه بعد ذلك في استخدامات ثانوية» يثير الكثير من الأسئلة الأخلاقية التي لا 
تتعلق بالخصوصية وحماية البيانات فحسب. بل تتعلق كذلك بالحوكمة» ومن الأمثلة 
الواضحة والمتعلقة بالحوكمة هو التحكم في الانسلال. 

إن التحكم في الانسلال يحدث عندما تكون البيانات التي تم إنشاؤها لشكل من أشكال 
الحوكمة مشابه لشكل آخر )2001 .(Innes‏ وحدث هذا غالبا بشكل شديد الوضوح فيما 
يتعلق بالأمن وخصوصاً بعد أحداث الحادي عشر من سبتمبر. حيث تم إعادة توظيف 
البيانات الخاصة بخطوط الطيران والبيانات الإدارية الحكومية من أجل تنميط وتقييم 
مخاطر الأمن للركاب .(Lyon 2003b)‏ وعلى نحو مشابه» فلقد تم إعادة توظيف كاميرات 
الإشارات المرورية ورسوم الازدحام في لندن من أجل القيام مهام تتعلق بالأمن: وذلك بدلا 
من مراقبة الانتهاكات ال مرورية فحسب (Dodge and Kitchin 2007a)‏ ومن الأمثلة 
التجارية على التحكم في الانسلال هو نظام الملاحة في السيارات ال مستأجرة حيث يتم إعادة 
توظيف هذا النظام من مساعدة السائقين على إيجاد طريقهم فحسب إلى مراقبة وفرض 
غرامة على هؤلاء الذين يقودون خارج المسار أو يخرجون من الولاية )2004 Elliott‏ 
فالتحكم في الانسلال يقوض بشكل منهجي الأسباب المنطقية وراء تقليص البيانات» في حين 
أن نشره يشكل تهديدات واضحة للحريات اممدنية» حيث يكون جميع المواطنين» سواء 
الأبرياء أو المذنبين» خاضعين طراقبته وإجراءاته التأديبية. 
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وهناك Js‏ آخر على الاستخدام الثانوي للبيانات والذي ينتهك الحريات المدنية ألا 
وهو الحوكمة الاستباقية (التوقعية). وهناء يتم استخدام التحليلات التنبئية من أجل 
تقييم السلوكيات أو الأحداث المستقبلية المحتملة والتوجيه باتخاذ الإجراء المناسب. فمثل 
odas‏ الحؤكمة اللسساقية تعد سمة من سات A adl‏ ءالعو خلال عند من Elud‏ 
حيث يتم تنميط المسافرين من أجل المخاطر والتحقق الأمني وذلك قبل البدء في الرحلة 
.(Dodge and Kitchin 2004)‏ وباممثل» تستخدم العديد من قوات الشرطة في الولايات 
ا متحدة الأمريكية التحليلات التنبئية من أجل توقع موقع الجرائم المستقبلية أو من أجل 
توجيه ضباط الشرطة لزيادة دورياتهم في هذه المناطق )2013 (Siegel‏ وعلى النحو «l3‏ 
تستخدم بعض الشركات مثل هيوليت باكارد (Hewlett Packard)‏ التحليلات التنبئية من 
أجل تقييم ومعرفة مَنْ منّ الموظفين من المحتمل أن يغادر الشركةء ومن ثم التدخل بشكل 
استباقي من أجل تقليل Süs‏ استبدال الموظفين )2013 (Siegel‏ وف مثل هذه الحالات» 
فإن آثار البيانات الخاصة بالشخص تقوم ها هو أكثر من تتبع الأشخاص» إذ تقوم باستباق 
هؤلاء الأشخاص )2002 (Stalder‏ 

إن مثل هذه الأساليب من الحوكمة تفرض قضايا أخلاقية بسبب أنها توجه الاهتمام 
إلى مجموعات وأماكن معينةء وهي كذلك تسعى طراقبة السلوكيات التي رها لن تحدث 
على الإطلاق. وخلال هذه العملية. كما تقوم بإعادة تشكيل كيف هكن للناس العمل من 
خلال الانضباط .(Harcourt 2006) (313 Jl‏ وعلاوة على ذلك» فإن مثل هذه التحليلات 
التنبئية تعمل في غالب الأحيان على تفاقم التحامل والتمييزء وتعمل كذلك على تأسيس 
النبوءات المحققة لذاتها (التوجه نحو إشباع الذات) )2013 .(Harcourt 2006; Siegel‏ 
ومن ثم فلقد ادعى 128 :2013( :(Raley‏ "إن البيانات في هذا المجال تكون أدائية: فتجميع 
أجزاء وبتات (bits)‏ من البيانات في ملفات شخصية لمشتبه به في الإرهابء وإعادة تأسيس 
البيانات المجردة عند استهداف حياة واقعية سوف يكون لهما تأثير على إنتاج هذه الحياة, 
هذا الشخص.ء كمشتبه به بالإرهاب بالفعل". ومن ثم يتم وضع الفرد تحت بؤرة المراقبة 
وممارسات مراقبة الدولة» وجعله خاضعا لنتائج وتداعيات كونه مشتبها به بالإرهاب» على 
الرغم من عدم التيقن من هذا الاشتباه. وبعبارة أخرىء تتم معاملة الشخص بطريقة 
مختلفة من جراء التوقع بأنه را يكون شيئاً ماء في حين أنه رها يُكن هذا الشيء أو 
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لايكنه أو رما يرتكب هذا الفعل أو لا يرتكبه. وفي حين أن النوايا وراء هذا العمل 
ربماتكون نوايا عظيمة وحسنة. إلا أن التوقع في هذه الحالة له تداعيات تتجاوز منع 
الأحداث (Harcourt 2006) =ô gzl‏ وكما هو الحال مع الأشكال الأخرى من التنميط 
فإن الحوكمة التنبئية يتم توجيهها بشكل كبير من خلال خوارزميات الصندوق الأسود التي 
تعمل على بيانات ذات أصل غير معروف» وهي على وجه العموم منغلقة على حق الرجوع 
(النقد). فالحوكمة التنبئية كانت مثار القليل للغاية من الاهتمام النقدي أو المناقشات 
وذلك ها يتعلق بتأثيراتهاء وعلى الرغم من ذلك تم تطويرها بفعالية من أجل استخدامها 
في الحكومات والشركات. 


Modes of Governance and) أساليب الحوكمة والضوابط التقنية‎ 
:(Technological Lock-Ins 

بعيداً عن التحكم في الانسلال والتنميط التنبئي» فإن ثورة البيانات لها تأثيرات محتملة 
فيما يتعلق بتنظيم وتشغيل الحوكمة. وإذا وضعنا في الاعتبار الشبكة المتسعة لجمع 
البيانات» وقراراتها الدقيقةء فإن قلق الكثير من المعلقين ينبع من أن عصر ظهور البيانات 
الكبيرة يسبق عصر ظهور ما أصطلح على تسميته وصاية الأخ الأكبر .(Big Brother)‏ وهذا 
يعني أننا في عصر أضحت فيه الدولة وا مؤسسات تعرف وتتوقع الكثير جداً عن الأفراد من 
خلال مراقبة البيانات والتنميط التنبئي لدرجة أنهم يمتلكون السلطة لفرض أشكال قاسية 
وضارة من التحكم الانضباطي. 

وكما أشرنا إلى ذلك خلال هذا الفصلء فنحن نعيش وبدون شك في عصر الممراقبة الزائدة 
بشكل مبالغ فيه. حيث أصبحت المراقبة أكثر اتصالاً من أي وقت مضى» وهي مدعومة من 
خلال تزايد ثقافة السيطرة التي ترغب في الأمنء والاستقرار وتقليل المخاطر (2007 (Lyon‏ 
وهناء يتم تشريع نوع جديد من الحوكمة» وهو نوع يؤول فيه تنظيم جوانب معينة 
من الحياة اليومية إلى الأنظمة التقنية ال مملوءة بالتوكيل الثانوي Kitchin and Dodge)‏ 
71. فعلى سبيل JULI‏ فإن (d$, xe‏ ومعالجة وإدارة الانتهاكات المرورية تتم بشكل 
متزايد من خلال الأنظمة الآليةء والمسموح بها من خلال برنامج يقوم بمعالجة البيانات التي 
تتعلق بأرقام اللوحات» «e all‏ وحق الوصولء وإحالة هذه البيانات إلى قواعد بيانات 
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ا ملكية من أجل فرض غرامات أو خصم (Dodge and Kitchin 2007a) Ji JS zo bl‏ 
وعلى النقيض من الأشكال التقليدية من المراقبة التي تسعى إلى تشجيع الانضباط GIUI‏ 
فإن الأنظمة الآلية تقوم بإعادة تشكيل السلوك بشكل فاعل Agre 1994; Kitchin and)‏ 
(Dodge 2011‏ وف مثل هذه الأنظمة: فإن آليات إنشاء البيانات وتنظيمها تعتبر مجالاً 
مهماً للغاية من cei]‏ وذلك بدلا من كونها جزءاً خارجاً عن النظام. فعلى سبيل المثاله 
Yas‏ من أن يقوم عمال صناديق المحاسبة بإجراء الانضباط الذاتي معدل عملهم لأنهم رها 
أو رما لا يعرفون أنه تتم مراقبتهم من خلال كاميرات المراقبة التلفزيونية ذات الدائرة 
ا مغلقة» فإن عمل مسح البضائع ومعالجة المدفوعات هي الوسائل التي يتم من خلالها 
مراقبة معدل العمل بشكل مستمر. وفي مثل هذه الأنظمة/ فإن المراقبة وآثار البيانات 
ا مرتبطة بهذه مراقبة أصبحت مستمرةء ومتغلغلةء ومواظبة. ومتفاعلة. مع سلوك الخاضع 

لها. ولكنها تقع خارج سيطرته )2012 (Cohen‏ 


إن البيانات التي تكونت بشكل آلي لا يستخدم جميعها من أجل تشريع الإدارة الآلية, 
ولكن هذا هو الاتجاه السائد بشكل متزايد» وخاصة للأنظمة عالية التنظيم. وعلاوة على 
ذلك» فإن الأساليب الجديدة من التحكم» إلى «OI‏ لا يتم السماح بها بالطريقة الصارمة 
التي توقعتها رؤية جورج أورويل (George Orwell)‏ في روايته eI"‏ الأكبر"» فهذه 
الأساليب عادية وروتينية ومغرية وتشجع المواطنين على أن يشاركوا بفعالية وبتلقائية 
في ممارساتها )2012 Ce (Kitchin and Dodge 2011; Cohen‏ لذلك» فإنه وكما 
ذكر )2007( (Solovo‏ فإن البيانات الكبيرة لا تتعلق بشكل كبير مباشرة رؤية جورج 
أورويل ولكنها ترتبط بشكل أكبر برؤية كافكا (Kafka)‏ كونها تطرح قضايا عن الإجراءات 
الواجب اتخاذها فيما يتعلق باللامبالاة. ce az I‏ الانتهاكات» الإحباط نقص الشفافية, 
والاستعانة أكثر مما تطرحه عن التسلط والاستبداد. وعلى النقيض من EUS‏ فبالنسبة U‏ 
قاله )2013( Boellstroff‏ فإن المجاز الأساسي في البيانات الكبيرة وا مراقبة ليس الرؤية 
الكلية ولكن بالأحرى هو التسليم» فبدلاً من أن يكون الفرد خاضعاً على نحو صرف لرقابة 
انتهاكية, يُسلم الناس بحماس ببياناتهم من خلال وسائل التواصل الاجتماعيء أو من خلال 
الانضمام في برامج بطاقات الولاء... إلخ. وبغض النظر عن الصياغة التصورية للعملية, 
فمن الواضح أن هذه الأنظمة الجديدة لها تأثيرات فيما يتعلق بالسلطة والسيطرةء وتقوم 
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بتشكيا التجارب والفرص الحياتية بطريقة مختلفة, وأن دور البيانات ومراقبة البيانات à‏ 
مثل هذه الأنظمة يتطلب اهتماما نقديا إضافيا. 


إن من الطرق التي يتم من خلالها تحويل الحوكمة من قبل التقنيات التي تدعمها 
البيانات أن نجعل الحوكمة أكثر تكنوقراطية بطبيعتها (معتمدة على التقنية بشكل كلي). 
فعلى سبيل المثالء فإن النزعة تجاه إدارة وتنظيم المدن من خلال أنظمة المعلومات 
والأنظمة التحليلية تعزز الأسلوب التكنوقراطي للحوكمة المدنية التي تفترض أنه من 
ا ممكن قياس ومراقبة جميع المجالات المدينة ومعاملة هذه المجالات على أنها مشاكل فنية 
يمكن التعامل معها ومجابهتها من خلال الحلول الفنية )2014 (Kitchin‏ وهي توضح ما 
أطلق عليه )2013( Mattern‏ مصطلح "العقلانية الأدائية". وما أطلق عليه Morozov)‏ 
3) "مقاربة الحلول التقنية" حيث ممكن تجزتة المواقف الاجتماعية ال معقدة إلى مشاكل 
محددة بشكل دقيق يمكن حلها أو البحث عن أفضل الحلول لها من خلال الحوسبة. 
ومرة أخرىء فإن هذا يعد تجسيداً للبيانات الكبيرة حيث يمكنها أن توفر إجابات لجميع 
المشاكل )2013 (Mattern‏ ومن خلال التقاط وتمثيل الظواهر كبيانات بشكل آني أو 
لحظيء يصبح من الممكن من الناحية الظاهرية تخطيط. وفهم» وإدارةء وإصلاح ال موقف 
أو المشكلة حال حدوثها. وقد أوضح )2013( Hill‏ أن "تفكير المدينة الذكية" ينم عن 
وجهة نظر تكنوقراطية ob‏ المدينة هي شيء يتعين علينا فهمه بالتفصيل كار محرك أو 
محطة الطاقة النووية وذلك في حال كان لدينا بيانات كافية فقط. وأنه تبعاً لذلك سيمكننا 
السيطرة على هذه الممدينة من خلال القوة الغاشمة للعلم والهندسة. وف الواقع» فقد اقترح 
Matten (2013)‏ أن تحضر البيانات الكبيرة يعاني من تراكم البيانات» وهو افتراض أن جميع 
التدفقات والأنشطة الهادفة هكن الإحساس بها وقياسها. وداخل مثل هذا التفكير هناك 
افتراض واضح في الغالب وهو أن الكون تشكل من قبل المعايير القابلة للمعرفة والقابلة 
للتحديد والتي تؤكد LJ‏ أنه لو كان بإمكاننا قياس جميع هذه اممعاییر» فسوف نكون قادرين 
على التنبؤ والاستجابة بتمكن تام وفقاً لذلك )2012 (Haque‏ وعلى الرغم من ذلك» لن 
يكون بمقدور الحلول التقنية بذاتها حل المشاكل الهيكلية المتأصلة في المدن لأن هذه الحلول 
لا تتعامل مع أسباب تأصل تلك المشاكل. ولكن بدلا من ذلك, فإن هذه الحلول تمكن فقط 
من إدارة مظاهر تلك المشاكل بش JS‏ أكثر فعالية. وفي حين أن تقنيات المدن الذكية مثل 
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أساليب التحليل اللحظية والآنية يتم الدفع بها كوصفة للتعامل مع جميع قضايا الحوكمة 
المدنية» إلا أن هذه التقنيات في الغالب الأعم تداري الشقوق بدلا من إصلاحهاء إلا إذا 
واكب هذه التقنيات مجموعة أخرى من السياسات )2014 .(Kitchin‏ وممكن أن ينطبق 
الأمر نفسه على الطرق التكنوقراطية المطبقة في بعض المجالات الأخرىء فأساليب الحوكمة 
التي تقودها البيانات تضمن بالفعل تنفيذ إستراتيجيات مدعومة بالأسانيد ولكن يجب أن 
تكون مقترنة بالسياقء ومرنة» ومستهدفة بشكل ملائم» ولا يتم إدارتها ببساطة من خلال 
الأرقام والخوارزميات. 
ويتزامن مع ذلك الانتقاد القائل أن الحوكمة أصبحت مبنية على معرفة تامة وتكنوقراطية 
مفرطة ومع الخوف من أن يتم الاستيلاء عليها وتشكيلها بشكل صريح من قبل مصالح 
الشركات من أجل تحقيق مكاسب شخصية. وبالعودة إلى JELI‏ المتعلق ببرنامج ا مدينة 
الذكية ومثال الحوكمة البلديةء وكما أشرنا إلى ذلك في الفصل a al‏ فإن loas‏ من أكبر 
شركات خدمات البرامج والأجهزة يسعى بشكل فعال إلى التعاقد من الباطن على مجالات 
من الإدارة المدنية وأن تجعل من بضاعتهم جزءًا Y‏ يتجزأ وذات دور جوهري في كيفية 
مراقبة وتنظيم العديد من مجالات الحياة في المدينة )2013 (Kitchin 2014; Townsend‏ 
إن الهاجس والقلق النابع من خصخصة الإدارة المدنية ذو ثلاثة أوجه )2014 (Kitchin‏ 
e‏ أولاً: أنه يعزز بشكل فعال الاقتصاد السياسي للليبرالية الجديدة والتحول نحو اقتصاد 
السوق في القطاع العام حيث يتم إدارة وظائف المدينة من أجل تحقيق الربح 
الخاص )2008 .(Hollands‏ 
ab ٠‏ أنه يؤسس للقيد التقني الذي يجعل المدن مدينة وممنونة بالفضل ممنصات ومزودي 
خدمات تقنية معينة خلال مدة زمنية طويلة» مما يخلق مواقف احتكارية )2013 (Hill‏ 
والخطر في هذه الحالة يكمن في تأسيس تبعية للمسار المؤسسي مما لا يمكن إلغاؤه أو 
التحول عنه بسهولة )2012 (Bates‏ 
٠‏ ثالثا: أنه يؤدي إلى حلول مغلفة أساسها "نظام واحد مناسب لجميع المدن الذكية" والتي 
لا تضع في اعتبارها إلا بشكل ضئيل للغاية خصوصية وتفرد الأماكنء والناس, والثقافات» 
وتقيد إدارة المدينة على أسلوب تكنوقراطي ذي رؤية ضيقة للحوكمة )2013 (Townsend‏ 
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وإذا ما أستحضرنا الواقع» فإن شركة IBM‏ في الوقت الحالي منتجا يسمى "مركز عمليات 
IBM‏ الذي" الذي يجمع العديد من الأنظمة التي تم تصميمها لمدينة ريو دي جانيرو في 
منتج واحد هكن تطبيقه على أي مدينة Singer 2012c)‏ انظر الفصل السابع). ولا يعني 
هذا أن نقول إن القيود التي تفرضها الشركات أمر حتمي» ولكن من الواضح أن ذلك Jie‏ 
رغبة عدد من أكبر الشركات العاملة في هذا المجال. وبالمثلء يتم استهداف أشكال أخرى 
من الحوكمة بشكل متزايد من خلال الشركات التي تسعى إلى إيجاد أسواق للحلول التقنية. 
ومرة 5551« فإن تداعيات مثل هذه الأشكال من الحوكمة تتطلب الكثير من التدقيق. 


الخاتمة: 

ناقش هذا الفصل التداعيات الأخلاقية, والاجتماعية. والسياسية. والقانونية للتغييرات 
التي تحدث من جراء تكوين البيانات ودمج البيانات واستخدام البيانات. ومن الواضح 
أنه في حين أن مثل هذه الممارسات لها فوائد بالنسبة للحكومات والشركات والمواطنين» 
إلا أنها في الوقت نفسه لها تداعيات سلبية وتمييزية. وإذا وضعنا في الاعتبار السرعة التي 
يتغير بها مشهد البيانات» فإن مواكبة التطورات وتحديد الآثار ا محتملة لهذه التطورات» 
ودراسة ردود الفعل الاجتماعية والقانونية ا مناسبة يعتبر تحديًا هائلاً. وف الواقع» هناك 
الكثير من الأسئلة الأساسية المعيارية التي تنطلب دراسة تأملية والتي تتعلق من يمكنه 
تكوين مجموعات البيانات والوصول إليها ومشاركتها وتحليلهاء ولأي غرض وف أي سياق 
وتحت أي معوقات أو قيود )673 :2012 .(boyd and Crawford‏ إن الحاجة إلى إجابات 
ممشل هذه الأسئلة أمر ملح» وذلك إذا وضعنا في الاعتبار ا مدى والتأثيرات المترتبة على 
مراقبة البيانات وانتهاك الخصوصية والأمن غير المحكم للبيانات» والتأثيرات الضارة للفرز 
الاجتماعي والاستبعاد. والطبيعة والأساليب المتغيرة للحوكمة. فحتى لو كانت الاستجابة 
سريعة ومبالغ فيهاء فإن الإجابات المترتبة ستكون متنوعة» حيث إن العديد من أصحاب 
ا لمصلحة يسعون وراء إستراتيجيات بديلة من أجل التعامل مع المخاوف العديدة. بحسب ما 
يتضح من خلال المناهج المقترحة لتفتت وانتهاكات الخصوصية. ‏ ونتيجة لذلك» هكن للمره 
أن يتوقع الكثير من ا مناقشات في السنوات القادمة فيما يتعلق بإدارة العناصر العديدة 
في ثورة البيانات. وعلى وجه الخصوص. وكما ناقشنا في الفصل الثاني» فإنه من المحتمل أن 
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يوضع عمل سماسرة البيانات تحت التدقيق المتزايد سواء من جانب الحكومة أو المواطنين. 

ومن منظور أكاديميء من ell‏ للغاية أن يضطلع العلماء بدور Jeb‏ في استقصاء ودراسة 
القضايا القانونية والسياسية والاجتماعية والأخلاقية التي Las‏ نتيجة لثورة البيانات» مع 
التتبع والإسهام في المناقشات العديدة المستمرة. يحتاج Jio‏ هذا العمل إلى أن يشتمل من 
جانب على دراسات حالة تجريبية مفصلة توثق التأثيرات المادية والاستطرادية الناتجة عن 
كيفية توظيف البيانات» ومن جانب آخر على البحوث والرسائل المعيارية والشاملة التي 
تحدد تأثيرات تجميع العديد من البيانات والطرق البديلة الممكنة. وحتى هذه اللحظة, 
فإن معظم الإسهامات كهذا الفصل والأعمال التي يناقشها تكونت من الجانب الأخير مع 
وجود القليل جدا من الدراسات التجريبية على بعض الأنظمة الاجتماعية الفنية ا محددة 
ونتائج هذه الدراسات. إن مثل هذه الدراسات مهمة للغاية لأنها تكشف الطرق ال ملموسة 
التي تم من خلالها تقديم مبررات لتجميع البيانات» وكذلك المهام التي يتم ممارستها وكيف 
يتم قبولهاء وإعادة تنقيحهاء ومقاومتهاء وإفسادهاء وانتهاكها من قبل المجتمعات» وهذه 
الدراسات توفر أيضا قاعدة أدلة يتم من خلالها تصور كيف هكن إعادة تأطير مثل هذه 
الأنظمة أو إعادة تحديد الغرض منها. 
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(Making Sense of the Data Revolution) 


ناقش هذا الكتاب قضية أنه يتعين أن تكون هناك حاجة إلى تعاط أكثر نقدية وفلسفية 
مع البيانات als‏ ثدرة النيافات ما زالث à A48‏ الوقت all‏ وفيما يضاق بار الأول 
ادعى البعض أن البيانات تمثل عناصر أساسية لإنتاج ال معرفةء ومع ذلكء فحتى الوقت 
الراهن لم تحظ الصياغة الوجودية للبيانات وا مجاميع المحيطة بإنتاج البيانات واستخدامها 
بالاهتمام الكافي. وبدلاً من ذلك فإن التركيز كان منهجياً بصورة أكبر فيما يتعلق بتكوين 
البيانات» أو أن التركيز كان على الأشكال الاشتقاقية للمعلومات والمعارف. وفيما يتعلق 
بالأمر الثاني ادعى البعض أن تدرج البيانات الصغيرة في البنى التحتية للبيانات وإتاحة 
الوصول للبيانات التي كان الوصول إليها محدوداً في السابقء وظاهرة البيانات الكبيرة 
تدمر الابتكارات ولا تدعمها أو تحافظ عليهاء فهي تغير طبيعة البيانات من حيث حجم 
هذه البيانات» وسرعتهاء وش موليتهاء وعلائقيتها ودلاليتهاء ومرونتها وتوسعهاء وتنوعهاء 
وانفتاحها وتبادليتهاء وهي السبب في ظهور مجاميع بيانات جديدة وطرق جديدة لفهم 
العام الذي نعيش فيه. إن التأثيرات التدميرية لثورة البيانات لها تداعيات هائلة على 
الحكومات والشركات والمجتمع المدني وذلك من خلال إنشائها لمعارف وممارسات جديدة 
يمكن استخدامها من أجل إعادة صياغة كيف يمكن أن يتم حكم الناس» وكيف يمكن أن 
تتم إدارة المنظماتء وكيف هكن أن تتم زيادة القيمة والفائدة» وكيف يكن أن يتم تكوين 
رأس JUI‏ وكيف هكن أن يتم تحسين الأماكن» وكيف هكن أن تتم إعادة تخطيط وممارسة 
العلم. وهي أيضًا أثارت العديد من التحديات وطرحت الكثير من الأسئلة. ومكنت لوسائل 
أكثر شيوعاً فيما يتعلق بمراقبة البيانات» وتقويض الخصوصية. وتنميط الأشخاص والأماكن 
والفرز الاجتماعي» ومهدت لسن أشكال جديدة من الحوكمة. فهذا الفصل الأخير يحدد 
خطة طريق دلالية من أجل إدراك وفهم البيانات وثورة البيانات وذلك بالنظر إلى الفجوات 
الحالية في الفكر المفاهيمي والمعرفة. ويشير هذا الفصل إلى أن مثل هذا الفهم بحاجة 
إلى أن يحدث بطريقتين: الأوى» من خلال التفكير الفلسفي الشامل والتحليل النقدي 
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ووظيفية وتطور مجاميع البيانات. 


فهم البيانات وثورة البيانات :(Understanding Data and the Data Revolution)‏ 
إذا وضعنا في الاعتبار فائدة وقيمة البيانات» فهناك حاجة ملحة للنظر إليهم من وجهة 
النظر الفلسفية والمفاهيمية. فالفلسفة» كما ادعى )1921( Wittgenstein‏ هي التوضيح 
المنطقي oS‏ فكل مدرسة من مدارس الفكر A55‏ نظاماً للأفكار ومنظوراً لفهم العام. 
ومصطلح cele‏ تتشكل JS‏ مدرسة وتختلف عن المدارس الأخرى من خلال أربعة مكونات 
-الوجودية (Ontology)‏ والمعرفية (Epistemology)‏ والأيدلوجية (Ideology)‏ 
والمنهجية (Methodology)‏ - وهذه المكونات هي التي تحدد معاييرها. فالوجودية هي 
مجموعة من المعتقدات التي تتعلق بطبيعة الوجود» وهي تهتم Ue‏ هو موجود وما يمكن 
ملاحظته ومعرفته. وبالنسبة للبيانات» فالوجودية تتعلق بماهية البيانات. ما الطبيعة 
الأساسية للبيانات؟ أما المعرفية فهي تتعلق بكيفية استخلاص ال معرفة أو الوصول إليهاء 
وهي الافتراضات عن كيف هكننا معرفة العام معنى كيف أصبح بإمكاننا معرفة البيانات؟ 
وهي أيضًا تتعلق بكيفية حشد البيانات في ممارسة التعلم. أما الأيدلوجية فهي تتعلق 
بالسياسات الضمنية والغرض من إنتاج ال معرفة والمدى الذي يسعى من خلاله المنهج لكي 
يكون محايداً بمعنى أن يكون موضوعيًا وغير تقويميء أو المدى الذي يسعى من خلاله 
المنهج بفعالية للتدخل وتغيير العام. وحيث CUS‏ ينطوي تحت مفهوم الأيدولوجية العديد 
من الأسئلة مثل هل البيانات سابقة للحقيقة؟ وهل هي سابقة للتحليل وبلاغية؟ أو هل 
البيانات اجتماعية أم سياسية؟ وهل تمت صياغة هذه البيانات بفعالية؟ أما المنهجية 
فهي مجموعة الإجراءات المستخدمة من أجل تفعيل سؤال أو نظرية ضمن الافتراضات 
الوجودية أو المعرفية للفلس dà‏ الإجمالية للبحث. وهي تشكل اختيار الأساليب التي يتم 
من خلالها تكوين وتحليل البيانات» فالمنهجية والأساليب مرتبطان بشكل «83s‏ ولكن ما 
طبيعة هذه العلاقة بينهما؟ 
لقد شرع الفصل الأول في تقديم إجابات أولية عن هذه الأسئلة وقدم أيضا صياغة لفهم 
البيانات من منظور فلس في مكن من فصل هذه البيانات عن كونها مجرد "مواد خام" 
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للمعلومات وا معارف. فالبعض ادعى أن البيانات اجتماعية ومادية» وأن البيانات لا تمثل 
العام فحسب» ولكنها تنتج هذا العام بشكل فعال. وادعى البعض أيضًا أن البيانات لا توجد 
بشكل مستقل عن الأفكارء والأساليب» والتقنيات» والناس» والسياقات التي تنتج» «giis‏ 
وتديرء وتحلل» وتخزن هذه البيانات. وف الواقع» يتم تنظيم البيانات وتخزينها في قواعد 
البيانات والبنى التحتية للبيانات التي تشكل لب المجاميع الاجتماعية الفنية المعقدة. وكما 
تم الإشارة إليه بالتفصيل في الفصل الأول» تشتمل هذه الأنظمة على أنظمة الفكرء وأشكال 
المعرفة» والتمويلء والاقتصاد السياسيء وأنماط الحاكمية. والتشريعات. والماديات» والبنى 
التحتية: وا ممارسات. والمنظمات والمؤسسات. والذاتيات وا مجتمعات. والأماكن والأسواق» 
وكل نظام من هذه الأنظمة يشتمل على عناصر عديدة (انظر الجدول .)١ - Y‏ فهذه 
العناصر تعمل سويا بطرق متعددة, واتفاقية وارتباطية وذلك من أجل الإنتاج الاستطرادي 
وامادي مجاميع البيانات (انظر الشكل .)١ - Y‏ لقد تم عبر هذا الكتاب مناقشة العديد من 
هذه المجاميع مثل البنى التحتية البحثية, وا محفوظات dubo‏ والبنى التحتية السيبرانية 
ومشروعات البيانات المفتوحة. وسماسرة البيانات» وأنظمة البيانات الحكومية» وأنظمة 
الأعمال. وكل واحدة من هذه المجاميع» بالرغم من أنها تتشارك في قواسم مشتركة» إلا أنها 
تتطور وتعمل بطرق مختلفةء وهي تتكون من مجموعة من الأنظمة والعناصر التي تتوسع 
بشكل مختلف (على سبيل JUI‏ من ال منظمات. والماديات المحلية. إلى الفرق المنتشرة, 
والقوانين الوطنيةء وفوق الوطنية إلى الأسواق العالمية) ولكنها على الرغم من ذلك مرتبطة 
داخل كوكبة فريدة. 

إن مثل هذه الصياغة تمكننا من جهة من التفكير في إنتاج البيانات وكيف هكن صياغة 
هذه البيانات بأشكال متعددة من النواحي الفنيةء والسياسية. والاقتصاديةء والأخلاقية, 
واممكانية» والزمانية» وصياغة استخدامات هذه البيانات والعمل الذي تقوم به في العالم, 
وتمكننا من الجهة 5551« من توجيه البحوث التجريبية التي تتعلق بمجاميع البيانات 
(انظر الجزء التالي). وهيء على الرغم من EUS‏ مجرد مجموعة واحدة من الطرق المحتملة 
لفهم البيانات» ومما لا شك فيه أنه بمرور الوقت سيتمكن العلماء من إنتاج مجموعة 
من المناظير التي يمكننا من خلالها فهم البيانات. إن تنوع وجهات النظر سوف يؤسس 
لعناصر تكميلية مثمرة للأفكار الجديدة ووجهات النظر المفاهيمية من أجل توجيه البحوث 
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التجريبية. وربما تشتمل هذه على تنظير البيانات من خلال منظار تأسيسي (بنيوي) أكبر 
يركز على دور هذه البيانات في تشغيل الرأسمالية المتأخرة» أو يستفيد من مفاهيم ما بعد 
البنيوية لدولوز (أحد أهم الفلاسفة الفرنسيين في النصف الثاني من القرن العشرين) التي 
تتعلق بأساليب الحوكمة الجذمورية (الجذمور: مفاهيم تتوزع على شبكة. بحيث تلتقي 
مع بعضها دون اشتراط اللزوم)» أو الانتقادات النسائية ما بعد الاستعمار للنوع الاجتماعي 
والإنتاج المْسَيّس وتوظيف البيانات. وبغض النظر عن المنظورء فا مطلوب هو تفكير عميق, 
وحريص ونقدي مع تنظير العمل من خلال دراسات الحالة التجريبية. 

إننا لسنا بحاجة إلى استكشاف الصياغات المفاهيمية للبيانات فحسب» ولكننا بحاجة, 
كما ناقشنا في الفصل الثامنء إلى دراسة كيف تطرح ثورة البيانات بعض التحديات أمام 
الفلسفات الحالية للعلوم. فالبيانات الكبيرة وتحليلات البيانات توفرء على وجه الخصوصء» 
إمكانية ظهور نموذج علمي ende‏ أي نهج معرفي جديد يتميز بكثافة البيانات ويتسم 
بالاستكشافية بطبيعته وذلك من أجل تطوير النظرية العلمية. فا محاولات الأولية للتفكير 
فيما يمكن أن يعنيه Jio‏ هذا التحول النموذجي كانت في غالب الأحيان مرتبكة ومضللة, 
وتعزز شكلاً من أشكال التجريبية التي يجدها الكثير من العلماء إبعادية وخطوة إلى الخلف 
وليست خطوة إلى الأمام. ويتعين استبدال هذا بمنظور أكثر فعالية مما يمكن أن يتكون 
منه العلم المساق بالبيانات من حيث معتقداته الفلسفية والمنهجية. لقد بدأ مثل هذا 
التفكير AIL‏ ومع ذلك فهناك حاجة ملحة إليه من أجل مواكبة إيقاع التغير التقني ونشر 
المنهجيات المخصصة والبراجماتية (الواقعية). وكذلك من أجل استبدال الأشكال التجريبية 
الضعيفة المنتشرة. فالتحول النموذجي أقل احتمالية في العلوم الإنسانية والاجتماعية» ولكن 
على الرغم من البيانات الكبيرةء فإن البيانات المفتوحة والبنى التحتية للبيانات توفر منهجيات 
وطرق جديدة للقضايا الاجتماعية. والثقافية» والسياسية» والاقتصادية» والتاريخية. فالفصل 
الثامن استعرض خطة تفصيلية باممزايا والانتقادات النسبية المتعلقة بالعلوم الإنسانية 
الرقمية والعلوم الاجتماعية الحسابية التي يتم تطويرهاء ولكن هناك حاجة ملحة لمناقشات 
كاملة وصريحة من شأنها استخراج النتائج من التحول المعرفي في الفكر وال ممارسةء ويجب أن 
تقوم مثل هذه المناقشات أيضا بتقييم دور ومزايا دراسات البيانات الصغيرةء وكذلك المناهج 
الهجينة التي تمزج أساليب ووسائل البيانات الصغيرة والبيانات الكبيرة. 


م ثورة البيانات البيانات الكبيرة» والبيانات المفتوحة» والبنى التحتية للبيانات» والنتائج المترتبة عنها 


فهم ثورة البيانات 


ومثل هذا التفكير يجب أن يواكبه تفكير آخرء موجه بشكل أكبر تجاه ا معيارية: في 
تكوين واستخدامات البيانات» وإنشاء وتشغيل مجاميع البيانات. وكما ناقشنا في الفصل 
العاشر» تطرح ثورة البيانات عدداً من القضايا الشائكة وذلك فيما يتعلق بالمدى الذي يتم 
على أساسه التقاط الحياة اليومية في مجاميع البيانات» وكيف أن بنية البيانات للناس تفوق 
وتضع قيوداً على حياتهم بج بجميع أنواع الطرق غير المتوقعة. فعلى سبيل «JULI‏ هل يجب 
ol‏ يتحلى الناس باممقدرة n‏ الوصول إلى جميع البيانات المتعلقة بهم وأن يكون لديهم 
الحق في تصحيح والاعتراض على هذه البيانات» أو تحليلات البيانات أو التنميط؟ وإلى أي 
مدى يجب أن يكون الناس قادرين على ممارسة الحق في أن يتم نسيانهم؟ وما هي الطرق 
التي هكن من خلالها إخضاع سماسرة البيانات لرقابة وتنظيم مستقلين» وخاصة عندما 
تكون بياناتهم وخوارزمياتهم تؤثر في الفرص الحياتية للناس؟ وما هو مدى تأمين الأنواع 
المختلفة من البيانات $ وما العقوبات ال محتملة على انتهاكات هذا التأمين؟ وما الحدود 
المشروعة للحكومات في تجميع ودمج البيانات عن مواطني هذه الحكومات؟ وإلى أي مدى 
يمكن إشراك المؤسسات في أعمال الحكومات وأنظمة الحوكمة؟ فهذه القضايا تتعلق iale‏ 
ا مجتمع cos E d‏ فيه في pas‏ وفرة البيانات» والإجابات عن هذه الأسئلة لها تداعيات 
وخاصة فيما يتعلق بإمكانية إعادة تصور وإعادة تهيئة مجاميع البيانات» وهذا يشمل 
الأشكل الجديدة من الحوكمة والتنظيم. فالعلماء القانونيون بدئوا بالفعل في التفكير في 
بعض القضايا مثل نتائج خصوصية البيانات الكبيرةء وبدؤوا كذلك في تقديم طرق بديلة 
للتعامل مع أكثر الآثار ضرراء ولكن من الواضح أن مثل هذه القضايا بعيدة كل البعد عن 
الحل» وأنها ستكون محل تركيز المناقشات المتطورة والصراعات التشر dass‏ وأن هناك حاجة 
ملحة للإسهام في هذا الحوار الفعال والصريح والمستمر. 

ويتزامن مع تطوير فهم مفاهيمي ومعياري أعمق وأفضل للبيانات» الحاجة إلى توفير 
وجهات نظر شاملة نقدية وكلية عن البنى التحتية للبيانات والبيانات المفتوحة والبيانات 
الكبيرة وتداعياتهم. لقد قدم هذا الكتاب تحلیلا m SL‏ من طرح فرضية تستند إلى 
بحث تجريبي شاملء واستفاد من الكتابات الأكادهية والإعلامية والصناعية. فهذا النهج ذو 
فائدة لأنه يجمع الأفكار والملاحظات is‏ هق مصادر متعددة وذلك من أجل تقديم نظرة 
أعم وأشمل عن المشهد المنتشر, مما يساعد على رسم وتصور الديناميكيات الأكبرء ودراسة 
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التأثيرات المحتملة لها. ومع ذلكء وعلى الرغم مما سبقء فإن المنظور العام الصعب» 
والتأمليء والشامل لثورة البيانات لا يزال ضعيفاً في الواقع العملي. وبدلاً من ذلك فهناك 
مجموعة من الكتب وعلى وجه الخصوص في مجالات الإدارةء والأعمالء والمجالات التقنية 
تعمل بشكل كبير على دعم البيانات ولكنها تفتقر للمنظ ور النقدي. Jes‏ النقيض من 
US‏ فالمطلوب تقارير متعددة الاختصاصات ومعقدة في تفكيرها. وف حين أنه من المفيد 
دراسة ثورة البيانات من خلال منظور متعدد الاختصاصات والأوجه» إلا أن هذا المنظور 
مقيد بشكل جذري وذلك بالنظر إلى الأجندة الشاملة والآثار المترتبة. وعلى نحو مشابهء OB‏ 
المفهوم القائل بأن ثورة البيانات تنتج البيانات التي هكن تفسيرها خارج سياقها أو المعارف 
خارج مجالها المخصص بحاجة إلى أن يتم إلغاؤه. وبدلا من EUS‏ فمن الضروري الاستفادة 
هن الأفكار lads‏ عبر الإختصاصات» حيث يعمل العلماء الذين يتمتعون بخبرات مختلفة 
TR‏ من أجل تقديم صورة أكثر dead‏ قوم )2012 .(Ruppert‏ 
ET‏ على ما سبقء فإن التحليلات أوجدت حاجة لكي نكون حريصين ألا ننزلق إلى 
الجدليات التافهة التي إما تحدد بشكل انفعالي حالة البيانات الكبيرةء والبيانات اللفتوحة, 
والب التحفية للماتاته أو توفر نقداً مستحكما جت أكثر lest‏ سلبية. لوقف y‏ 
كدة doses das sita‏ اوس إلا فيما ندرء وعلى النحو الذي تطرحه الجدليات 
الانفعالية. Juss‏ من ذلكء يتعين Ule‏ أن نقر ob‏ التطورات الحادثة AS‏ وارتباطية, 
وسياقية. وهي تنتشر بطرق فوضوية وأحياناً تناقضية وتباينية. وكما أشرنا إلى ذلك في 
الفصل التاسع» تعمل مجاميع البيانات في الغالب على كل من الإجبار والتحرير بشكل 
فوري ومتزامن» وأن مستهلي bel coL‏ يكونون هم منتجي البيانات» وأن الأنظمة 
تسعى إلى استنطاق المستخدمين بطرق عديدة. وعلى هذا النحوء فإن المجاميع Ul‏ مما 
تكون متشابكة ويتعين أن يتم فتحها وتفريغها بشكل حذر وذلك من أجل إظهار تدرجاتها 
الرمادية المتعددة. وعندما توجد تأثيرات تعمل بطرق مضرة وتمييزيةء فنحن بحاجة إلى 
تحديد الاستجابات الاجتماعية والقانونية المناسبة التي تحمي الحقوق الفردية والجماعية, 
ولكنها لا ترفض الكل لعدم رضاها عن الجزء. 
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دراسة مجاميع البيانات :(Researching Data Assemblages)‏ 
هناك ضرورة ملحة لإجراء بحوث تجريبية مفصلة عن 0353« وعملء وتعزيز مجاميع 
البيانات وذلك من أجل مواكبة وتعزيز التحليلات النقدية والمفاهيمية الأعم والأشمل. ففي 
الوقت الحاليء لدينا فهم متعمق قليل بكل من البناء الإجمالي لمجاميع البيانات وأجهزتها 
وعناصرها الفردية. ونتيجة UU‏ هناك حاجة ملحة لإجراء دراسات حالة تتتبع الترتيبات 
الفنية الاجتماعية لكافة اممجاميع» مثل تجميعة بيانات لسمسار ما أو البنية التحتية لبيانات 
بحث ماء أو حركة البيانات المفتوحة في مدينة ماء أو التوثيق المفصل مجالات معينة من 
أحد ا مجاميع» مثل ele‏ الاجتماع» والاقتصاد السياسي لمطوري البرمجيات Hackathons)‏ 
ومنتديات العطل الأسبوعية لمجموعات الاختصاص (Data Dives)‏ أو مجتمعات الممارسة 
داخل قطاع ما في البيانات الكبيرة. وبشكل نموذجيء فإن مثل هذه الدراسات ستكون 
دراسات مقارنة بطبيعتهاء تقارن التكرارات في تجميعة ماء على سبيل «JULI‏ عبر الأماكن أو 
«oui‏ أو عبر أنواع مختلفة من التجميعة. ومن شأن مثل بحوث dll‏ هذه أن OS‏ 
من تحديد العموميات والخصوصياتء وكذلك الطرق الاتفاقية والارتباطية المتنوعة التي 

تتسع من خلالها التجميعة ليتم تشكيلها. 

وهناك طرق عديدة يمكن من خلالها تفعيل مثل هذه البحوث. وهي تشمل تحليلات 
البيانات» كما تمت مناقشته في الفصل السادس» وذلك من أجل تحديد تركيب تجميعة 
ما والارتباطات والعلاقات بين العناصر. وسيكون Jib‏ هذا النهج فوائد عديدة وذلك من 
خلال استخدام قوة التنقيب عن البيانات والتعلم الآلي من أجل تحديد الأنماط داخل وعبر 
مجاميع كبيرة للبيانات» وكذلك من أجل تأسيس قوة نسبية للروابط. وهذا من شأنه أن 
يوق bliss ils Louis‏ للمجاميع وتشغيل هذه المجاميع. وعلى الرغم من ذلك وفيما 
يتعلق بفهم السياقء والاتفاقية والارتباطية المتعلقة بتجميعة ما -التداخل المعقد للكائن 
ومحيطه - فإنه من ا محتملء رها بشكل ساخرء أن مجموعة من المنهجيات الخاصة بالبيانات 
الف قد توقر تر L9‏ 3915 دقفا dag.‏ هذه المتيجياة عل سيل Ji‏ 
لا الحصرء على منهج علم الأصوا (Genealogies) J‏ ومنهج التفكيك (Deconstruction)‏ 
ومنهج الأعراق والثقافات (Ethnographies)‏ ومنهج مشاركة الملاحظ Observant)‏ 
(Participation‏ وهي تمثل مجموعة من ال منهجيات التي أيدت استخدامها في السابق 
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من أجل ea‏ البرامج )2011 (Kitchin and Dodge‏ والتخطيط );2009 Dodge et al.‏ 
(Kitchin et al. 2012 a‏ وتسعى كل منهجية إلى أن تحدد وتفكك بشكل 3435( الظواهر 
الاجتماعية: وكما بينت العناصر الأحد عشر, فإن مجاميع البيانات تعتبر اجتماعية بشكل 
كلي. ومن خلال استخدامها كمجموعة» فإن الإنتاج المادي والاستطرادي المنتشر gale‏ 
البيانات هكن 435525 لأغراض علميةء مما يوفر ما أطلق عليه )2013( Wang‏ مصطلح 

"البيانات الكثيفة"» أي الأفكار والقصص السياقية عن البيانات وإنتاج البيانات. 


إن علم الأصول يستخدم كثيراً من أجل تتبع الانتشار العرضي لنظام الأفكار أو مجموعة 
من الأفعال عبر الأوقات والأزمانء وذلك بدلا من إنتاج تأريخ dle‏ سليم Crowley)‏ 
9. وهذا يوضح كيف أن المستقبل يبنى على الماضيء ولكنه لا يتحدد بالضرورة من 
خلاله بطرق سببية مسببيه بسيطة. وعلى هذا النحوء يتم توظيف علم الأصول من أجل 
الحل والفهم بشكل تاريخي للتكرارات المتناقضة وال متغايرة أحياناء والمعقدة» والمتعددة 
لأحد مجاميع البيانات» أو أحد عناصرها وكذلك الفهم للانتشار المتطور والقائم للأفكارء 
والقرارات» والمعوقات, والأفعال, واللاعبين الذين أسهموا في تطور هذه ا مجاميع جنباً إلى 
جنب مع النهايات ا مسدودة والإخفاقات الواضحة )1977 usg (Foucault‏ فعل ذلك 
OB‏ هذا يحدد نقاط التجمع حيث يحتشد الناس أو الأفكار سوياً ويتسببون في ظهور 
مجاميع جديدة, وكذلك الطرق ال معقدة والفوضوية التي تتطور من خلالها هذه المجاميع 
بعد ذلك. وف حال ثورة البيانات» يمكن توظيف منهج علم الأصول من أجل تتبع تكوين 
وتطور البيانات المفتوحة والبنى التحتية للبيانات والبيانات الكبيرة بشكل أكثر عمومية, 
والتجسيد ال محدد لها. 

فعلى سبيل «JULI‏ هكن لشخص ما أن ينتج تأصيلاً مفصلاً لتطور حركة البيانات io gitl‏ 
بتعبيرات عامة. من خلال تتبع ظهور اللاعبينء والمنظمات. ونماذج التمويلء والأفكارء 
والأحداث e‏ 55 الوقت وعبر الزمن» والترابطات والتحالفات والخلافات بينهم» وتأثيراتهم 
على إعادة تشكيل مشهد البيانات من خلال إعادة تحديد السياسات التي تحيط بالحكومة 
التي آنتجت» واحتفظت» وكشفت Jio‏ هذه البيانات من أجل استخدامات أعم وأشمل. أو 
يمكن للشخص أن يشرع في تحديد أصل كيان فردي مثل مؤسسة dà sl‏ المفتوحة» وهي 
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مؤسسة غير ربحية تأسست ف العام 2004 في المملكة المتحدة» ونمت بسرعة لكي تصبح 
حركة دولية مؤثرة تطالب بالبيانات المفتوحة والحكومة المفتوحة. وهناء يمكن أن يسعى 
الفرد تجاه تتبع نشأة المنظمة» وتطور مهمتها وقيمهاء وتطور البنى التحتيةء والحوكمة 
«Jo salo‏ والأنشطة. والبرامج» والإصدارات» وانتشار تأثيرها وتفاعلاتها مع الهيئات الأخرى 
وهكذاء وذلك من أجل فهم الطريقة الاتفاقية والارتباطية لتوسعها وعملها على سبيل 
«JULI‏ وكذلك موقعها الحالي وسلطتها ضمن حركة البيانات المفتوحة الأعم. 

إن إجراء تحليل علم الأصول bole‏ ما يصاحبه الاستفادة من التفكيك. وهذه الطريقة من 
التحليل تجرد وتكشف ال معاني داخل النصوص ال مفهومة بشكل واسع مثل النصوص المكتوبةء 
والصورء والخرائط والأحاديث. ومزيج من هذه الأشياء تشكل في العادة ا محتوى للكتيبات 
وا مواقع الإلكترونية. فمن المفهوم أن النصوص هي الوسيط لكل من الرسائل الصريحة 
والضمنية» ومن خلال التفسير التشريحي للنص» يمكن فهم والكشف عن معان أعمق. ومن 
ناحية الجوهرء فإن التفكيك يبحث فيما يتجاوز الإشارات السطحية والقيم الاسمية لكي 
يواجه القراءات ell]‏ بها للنص وذلك من أجل الكشف عن الممعاني المخفية بداخله» أو ربط 
ا معاني المبسطة بشکل محكم )1989 .(Burman and MacLure 2005; Harley‏ فالتفكيك 
هو قراءة نقدية تستخدم أساليب Jio‏ استبدال المعاني أو القوة ا محتملة, أو تحديد نقاط 
التناقض أو التباين Je‏ حل النصية البينية والتضمين داخل الماديات والسياقات «eel‏ 
والتفكير في وضعية المتحدث والجمهور المستهدف له )2005 (Burman and MacLure‏ 
وكما أشرنا إلى ذلك بالتفصيل في الفصول الثاني والثالث والسابع» فإن البيانات المفتوحة 
ls Bate oS Dc OSEE eco‏ وو ER‏ الكل قا ني ی 
إلى إقناع الناس» والشركات» وا مؤسسات منطقها من أجل دعم وتبني والاستثمار في مبادثها 
ومنتجاتها. فالأنظمة الخطابية هذه ليست عامية ولكنها معقدة وفوضويةء فهي مزيج من 
المصالح المتعاونة والمتنافسة. ومن خلال استخدام التفكيك» فإن الأنظمة الخطابية لتجميعة 
ما أو عناصر معينة في هذه التجميعة. مثل الفئات العديدة في حركة البيانات المفتوحة أو 
شركات معينة تعمل على تعزيز حلول البيانات الكبيرة على القضايا ا مدنية: يمكن تجريدها 
وتفكيك رسالتها وتكوينهاء مما يكشف عن الممعاني» والأيدولوجيات (المعتقدات). والسلطات 
الكامنة داخل تصميمها وعرضها. 
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وتوفر دراسات الأعراق والثقافات تحليلات شاملة وهائلة لمجتمعات الممارسة من 
خلال التوثيق التفصيلي لتنظيمهاء وعملهاء وثقافتهاء وقواها المحركة الداخلية وارتباطاتها 
الخارجية )2000 (Herbert‏ وعلى نحو نموذجيء يوظف المنهج الإثنوغرافي (وصف 
الأعراق والثقافات) مزيجاً من مراقبة المشاركين التي يتم القيام بها عبر فترة زمنية ممتدة, 
ومقابلات شخصية متعمقة مع مجموعة كبيرة من المستفيدين الداخليين والخارجيين» مع 
تعزيز كل ما سبق بأساليب أخرى مثل القراءات التفسيرية للوثائق والأدوات ذات الصلة 
مثل المواقع الإلكترونية» وتبادلات البريد الإلكتروني» وأماكن العمل... إلخ. ومن الناحية 
الجوهرية» يسعى ele‏ دراسة الأعراق والثقافات إلى الفهم الدقيق للعام الحياتٍ لمجتمع 
ما - علاقاته diee VI‏ وإيقاعاته المتواترة. ومعانيه الثقافية, وأنماط السلطة. واتخاذ 
القرار فيه» وطرق كينونته.... إلخ - من أجل فهم كيف تشكل هذا المجتمع وكيف ينمو 
بشكل مستمر )2007 .(Crang and Cook‏ ويذهب الباحث هيدا مساو تقديم 
وصف سطحي لتوثيق الطرق المعقدة التي تعمل من خلالها المجتمعات من خلال كونها 
متضمنة داخل العلاقات وا ممارسات التي يتم دراستها. ومن شأن دراسة الأعراق والثقافات 
مجاميع البيانات أن تقدم بعد ذلك أوصافا تفصيلية شاملة عن كيف تم تكوينها وكيف 
تعمل على أرض الواقع. فعلى سبيل JELI‏ فإن دراسة الأعراق والثقافات للؤسسة ال معرفة 
المفتوحة سوف تتكون من باحث تم تضمينه داخل تلك المنظمة» وهو يشارك في التخطيط 
للاجتماعات. والأنشطة. والفعاليات» ويراقب تفاعلات العمال ويجري مقابلات شخصية 
مع المستفيدين الأساسيين للحصول على مدارك مباشرة حول عمليات اللاعبون الأساسيون 
في حركة البيانات اممفتوحة» وكيف يتم تأسيس وإدارة المكونات العديدة لمجاميع البيانات 
(بمعنى أنظمة الأفكار؛ والاقتصاد السياسي؛ وأنماط الحاكمية؛ والماديات؟ والبنى التحتية؛ 
إلخ) داخلها وعبرها. وعلى نحو مشابه» يمكن للفرد أن يجري دراسة الأعراق والثقافات 
داخل بنية تحتية معينة للبيانات» أو على سمسار للبيانات» أو داخل شركة للبيانات الكبيرة 
أو داخل أنواع معينة من الفعاليات مثل سباقات البرمجة أو المعارض وال مؤتمرات الصناعية, 
أو فرق البيانات الكبيرة داخل الحملات الانتخابية... إلخ. 

ويمكن أن يتم دعم مثل هذه الدارسات للأعراق والثقافات من خلال مشاركة 
الملاحظء. وهذا نوع من الدراسة الذاتية للأعراق والثقافات حيث يجري الباحث 
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دراسة مستدهة لارتباطاتهم وارتباطات الناس الآخرين بظاهرة أو ممارسة ما 
.(Crang and Cook 2007; Morton 2005)‏ وفيما يتعلق بثورة البيانات. من 
الممكن أن يتم مشاركة الملاحظين بحيث يكونون جزءاً من فريق يبني البنى التحتية 
للبيانات» أو يكونون أعضاءً في حركة البيانات المفتوحة» أو يعملون كعلماء للبيانات 
يوظفون البيانات الكبيرة من أجل معالجة قضية معينة... إلخ. ub‏ مثل هذا 
النهج يعتبر في الأصل تمريتا للانعكاس الذاتي. وهو تدريب شخصي وغير موضوعي» 
سيك بض اناس Jaislee‏ وبدقة بالغة لدراسة ممارساته وممارسات الآخرين 
à‏ سال ا خت كرون 189 ta‏ في هذا المجالء فالفائدة الأساسية ممثل هذا 
etl‏ تتمثل في أن الباحث يدرك بشكل كامل المشهد المتنوع والمعقد من النواحي 
الاجتماعية. والسياسية. والاقتصادية والذي يعمل من خلاله هذا الباحث ويعتبر 
أحد ا مشاركين الفاعلين فيه ويتعرض للعمليات المتعددة الجارية. ويظل الانتقاد 
الأساسي ال موجه Jib‏ هذا المنهج هو أنه من الممكن بدرجة كبيرة أن ينثني الباحث 
ويوضع في مكان ما بشكل شخصيء مما يفقده التمثيل العريضء dg‏ كم الستقادة 
من هذا ال منهج بشكل أمثل إذا ما تم دمجه مع طرق أخرى توفر سياقا أعم وأشمل. 

إن هذه الطرق تمثل مجموعة جزئية من مجموعة من الطرق ال محتملة لفهم مجاميع 
البيانات وعناصر هذه ا مجاميع» ومما لا شك فيه أن الكثير من هذه المناهج سوف يتم 
توظيفها من أجل إجراء بحوث تجريبية على طبيعة ثورة البيانات المنتشرة, إذ يوفر كل 
منهج رؤى مختلفة. وفي الواقع» فإن المنهج الذي يستخدم طرقاً مختلطة تمزج بين الرؤى 
السياقية المتعمقة للدراسات النوعية التي تستهدف البيانات الصغيرة وبين الدارسات الأعم 
التي ترطف coll cables‏ رما يكون سيلا مقيدا لاتباعه. وفي مثل هذه الدراسة, 

من الممكن استخدام تحليلات البيانات من أجل تقديم منظور شامل بمجاميع البيانات» أو 
الروابط أو التداخلات بين ال مجاميع» والتي يتم اتباعها بعد ذلك من خلال البحوث الأكثر 
hs‏ باستخدام الطرق التي تم تفصيلها من أجل توفير رؤى متعمقة للعلاقات والعمليات 
السارية داخل وبين هذه العناصر. أو من ال ممكن أن يكون هذا lo so esl‏ كنا B po‏ 
فيما يتعلق بالصيغةء وذلك على النحو الذي تمت الإشارة إليه بالتفصيل في المناقشات بشأن 
ele‏ البيانات في الفصل الثامن» حيث تم تبني التحليل التفسيري لتجميعة البيانات بشكل 
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الفصل الحادي عشر 


أكبر من اختبار الفرضيات التقليدي من أجل تحديد أكثر العناصر الفاعلة ظهوراً. ويمكن 
أن يعمل هذا المنهج أيضًا بشكل عكسيء حيث يتم استخدام البحوث المتعمقة المركزة من 
أجل توجيه انتشار تحليلات البيانات عبر عينة أكبر بكثير. وفي كلتا الحالتين» فإن agile JL‏ 
الأولى والثانية تعملان بتناغم بعضهما | مع بعض من أجل تعزيز المدارك والمعارف. ففي 
الحالة الأولى» يتم استخدام الصورة الأعم من أجل المساعدة في صياغة الفهم وتعميقه وقرنه 
بالسياقء أما في الحالة الثانيةء فإن الفهم المتعمق يوفر الأساس محاولة تأسيس أو وضع 


أفكار ختامية: 

لا تزال ثورة البيانات في طورها التمهيديء ولكنها تنتشر بسرعة بالغة. فخلال عدد 
من السنوات لا يتجاوز أصابع اليد الواحدة: كان للبيانات ال مفتوحة والبيانات الكبيرة 
والبنى التحتية للبيانات تأثيرات كبيرة على مشهد البيانات» وتزامن هذا مع مناقشات 
صوتية حماسية تعلن عن التأثيرات الإيجابية الخطيرة لها. إن سرعة التطورات التي تحدث 
تعني أن التحليل النقدي الموسع. والمتعمق, والمدروس يجد صعوبة بالغة في مواكبة تلك 
التطورات. ومما لا شك فيه أنه خلال السنوات القليلة القادمة سيكون هناك فيضان 
حقيقي من مثل هذه الدراسات التي تسعى إلى توثيق طبيعة وآثار مجاميع البيانات 
الناشئة. وكما ادعى البعض خلال هذا الفصلء فهناك حاجة ملحة لهذه الدراسات. إن 
هذا العمل سوف يحدد من جانب الطرق المناسبة لفهم ثورة البيانات» من خلال كل 
من التفكير المفاهيمي والدراسات النقدية. وعلى الجانب الآخرء سيوفر بيئة لتفكير أكثر 
معيارية فيما يتعلق بكيفية تطور وتنظيم وإدارة مشهد البيانات. وق الوقت الراهنء فإن 
الأخير يكون في الغالب تفاعليا ومفهومًا بشكل ضعيف» وتسيطر عليه المصالح المكتسبة. 
لقد سعى هذا الكتاب إلى تقديم تحليل أولي ومفاهيمي بشكل متوازن» ونقدي وشامل 
والذي من الممكن أن يساعد على توجيه الدارسات التي تتبعه. ولوقت طويل للغاية 
فإن البيانات وتكوين وعمل المجاميع التي تحيط بالبيانات قد تم الأخذ بها على أنها أمور 
مسلم بهاء في حين أن الاهتمام كان منصباً على المعلومات والمعارف المستقاة منهاء فالوقت 
قد حان لتدارك هذا الإهمال. 
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- العمل مع إدارة تقنية المعلومات بالمؤسسة العامة للتقاعد على تحليل بعض مشاكل 
القائمة. 

- العمل على تطوير أنظمة حاسوبية لشركة القصبي. 

- العمل والإشراف على تطوير Bae‏ أنظمة حاسوبية تطبيقية بكلية املك فهد الأمنية. 
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- القيام بدراسة تقييم تطبيقات أنظمة المعلومات من حيث النجاح والفشل ومن بينها 
نظام الإسعاف مدينة لندن وكارثة (LASDS).‏ عام MY‏ 

- دراسة تحليلية لتطبيق نظام ERP‏ لإدارة عمل جمعية الهلال الأحمر التركية (TRCS)‏ 
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حقوق الطبع Als‏ , فرظ à aa)‏ الإدارة العامة ولا بجو 
اقتباس جزء من هذا الكتاب أو إعادة طبعه بأية صورة دون موافقة 


كتابية من المعهد إلا في حالات الاقتباس القصير بغرض النقد 
والتحليلء مع وجوب ذكر المصدر. 





تم التصميم والإخراج الفني والطباعة في 
الإدارة العامة للطباعة والنشر بمعهد الإدارة العامة - 699 1ه 


هذا الكتاب 

19 ودقيق للبيانات وثورة البيانات الجارية حاليا. 
فالكتاب يسعى. من جهة, لبيان شتى الطرق والوسائل المتعلقة بإعادة تشكيل إنتاج ومعالجة 
وخليل وتبادل البيانات. Los‏ يعني هذا لكيفية إنتاج واستخدام المعلومات والمعرفة؛ وهو. من 
جهة أخرى. مهد للنقاش والتفكبر النقدي حول البيانات من حيث طبيعتها, وكيفية تأطيرها 

من النواحى الفنية والفلسفية والأخلاقية والاقتصادية والتجميعات التقنية والمؤسسبة 
TT‏ ويستند التحليل المقدم في هذا الكتاب إلى مشاركة واسعة النطاق وإلى Lo‏ 
سبقه من مؤلفات في مختلف العلوم. والعلوم الإنسانية, والعلوم الاجتماعية., ومن مطبوعات 
الثقافة الشعبية. والإصدارات الصاحاقية. والدوريات الصناعية: وإلى خبرة مباشرة في العمل 
على أنظمة حفظ أرشيفية وبنى ختية ومشاريع خليلات لبيانات على نطاق مؤسسي واسع. 
وبنقسم الكتاب الى a»‏ غشر pais ALa‏ الفصل الأول iole åd‏ ونقدا PC‏ حول مفهوم 
البيانات وكيفية فهم قواعد البيانات والبنى التحتية للبيانات. في حين يبحث الفصل الثاني في 
الدور المستمر للبيانات الصغيرة والكيفية التي تم بها توسيع نطاقها إلى أرشيفات/محفوظات ٠ ٠‏ 
رقمية وبنى ختية. إلى أن وصلت إلى درجة التداول وبيعها من خلال وسطاء الببانات. كما يناقش” r‏ 
الفصل الثالث الدافع للتوجه نحو استحداث البيانات المفتوحة والببانات المرتبطة at Lm a‏ 
التي يجري تقاسمها ومشاركتها وإعادة استخدامها على نطاق أوسع ui no cce‏ 
بمرور الوقت. ويبتن القصلان الرابع والخامس طبيعة BLUE‏ الكبيرة RS E E‏ 
بالتفصيل وعوامل التمكين تلبيانات الكبيرة ومصاذرها Sori E‏ 
المساعدة على انتشارها. ويقدّم الفصل السادس U d. Pa "E . åg‏ 
عامة عن مجموعة جديدة من خليلات البيانات M : C‏ ; 
التي ترمي إلى فقهم البيانات الصغيرة الموسعة e‏ ا E‏ 
والبيانات الكبيرة. كما درس الفصلان السابغ ‏ 5 AAA * Ob‏ 
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